Мы создаем AI-ассистента, который помогает исследователям быстро находить, извлекать и анализировать данные из разнообразных источников — от международных статистических баз до крупных административных датасетов.

Проект находится на стадии активного прототипирования: нужно в короткие сроки провести серию экспериментов, отобрать рабочие решения и собрать из них production-ready сервис.

Формат работы: на территории работодателя / гибрид

Локация: Москва, Тургеневская

Наш стек:
Yandex AI Studio / open-source LLM, LangChain/LlamaIndex, Qdrant, PostgreSQL, DuckDB, Parquet+S3, Docker, CI/CD, k8s (опционально)

Что предстоит:

  • Агентная архитектура (оркестрация, tool use, многошаговый reasoning)
  • Интеграции с API статбюро, генерация SQL, связка с RAG
  • RAG-компоненты: поиск по метаданным, документации API, переменным
  • LLM через Yandex AI Studio (подбор моделей, промпты, оценка качества)
  • Векторный поиск в Qdrant
  • Данные: PostgreSQL, DuckDB, Parquet в S3
  • Эксперименты «от идеи до прототипа за 2–3 дня»

Что для нас важно:

  • Понимание агентных систем и их отладки
  • Опыт с RAG от прототипа до production (галлюцинации, оценка качества)
  • Уверенное владение Python
  • DuckDB / аналитические СУБД — плюс
  • Комфорт с неопределённостью и самостоятельные решения
  • Английский (читать документацию, писать промпты)

Будет плюсом:

  • Опыт с экономикой/статистикой/финансами, большими статбазами
  • Опыт с open-source LLM (квантизация, fine-tuning)
  • Знание стандартов метаданных (SDMX, DCAT)

Оформление: проектная занятость в штат или годовой договор