Мы создаем AI-ассистента, который помогает исследователям быстро находить, извлекать и анализировать данные из разнообразных источников — от международных статистических баз до крупных административных датасетов.
Проект находится на стадии активного прототипирования: нужно в короткие сроки провести серию экспериментов, отобрать рабочие решения и собрать из них production-ready сервис.
Формат работы: на территории работодателя / гибрид
Локация: Москва, Тургеневская
Наш стек:
Yandex AI Studio / open-source LLM, LangChain/LlamaIndex, Qdrant, PostgreSQL, DuckDB, Parquet+S3, Docker, CI/CD, k8s (опционально)
Что предстоит:
- Агентная архитектура (оркестрация, tool use, многошаговый reasoning)
- Интеграции с API статбюро, генерация SQL, связка с RAG
- RAG-компоненты: поиск по метаданным, документации API, переменным
- LLM через Yandex AI Studio (подбор моделей, промпты, оценка качества)
- Векторный поиск в Qdrant
- Данные: PostgreSQL, DuckDB, Parquet в S3
- Эксперименты «от идеи до прототипа за 2–3 дня»
Что для нас важно:
- Понимание агентных систем и их отладки
- Опыт с RAG от прототипа до production (галлюцинации, оценка качества)
- Уверенное владение Python
- DuckDB / аналитические СУБД — плюс
- Комфорт с неопределённостью и самостоятельные решения
- Английский (читать документацию, писать промпты)
Будет плюсом:
- Опыт с экономикой/статистикой/финансами, большими статбазами
- Опыт с open-source LLM (квантизация, fine-tuning)
- Знание стандартов метаданных (SDMX, DCAT)
Оформление: проектная занятость в штат или годовой договор