Оформление: Штатная позиция (временная, на период декретного отпуска штатного сотрудника)
График: 5/2 (8 рабочих часов)
Формат работы: На месте работодателя
Описание вакансии
Центр Data-аналитики города Алматы приглашает LLM-инженера (Data Scientist) для участия в разработке интеллектуального мультиагентного чат-бота для анализа и визуализации городских данных.
Бот будет служить интеллектуальным интерфейсом к данным Ситуационного центра Алматы, предоставляя пользователям аналитику, интерактивные графики, карты и отчёты на основе запросов на естественном языке.
Обязанности:
-
Разработка и оптимизация LLM-агентов на базе актуальных моделей (в приоритете Anthropic Claude, опционально OpenAI) для извлечения и анализа данных.
-
Построение продвинутых систем RAG (Retrieval-Augmented Generation), включая методы управления контекстом (Context Engineering), его сжатие (Context compaction) и кэширование промптов.
-
Разработка и отладка логики Text-to-SQL для PostgreSQL с использованием механизмов Tool Use (Function Calling).
-
Интеграция AI-компонентов с бэкендом (FastAPI) и визуальными библиотеками (Plotly, Folium) для генерации интерактивной аналитики и отчетов в PDF/Excel.
-
Работа со стеком LLMOps (LangChain, Langfuse или аналоги) для оркестрации, логирования и контроля качества ответов модели.
Требования:
-
Опыт работы на позициях Data Scientist, AI Developer или LLM/ML Engineer от 3 лет.
-
Отличное знание Python и практический опыт разработки микросервисов на FastAPI.
-
Уверенное владение SQL и опыт работы с реляционными базами данных (PostgreSQL).
-
Глубокое понимание API передовых языковых моделей (Anthropic Claude, OpenAI) и паттернов их интеграции.
-
Опыт проектирования архитектуры диалоговых агентов с использованием фреймворков (Claude Agent SDK, LangChain, CrewAI).
-
Знание принципов работы векторных баз данных и систем оценки качества RAG-пайплайнов.
-
Умение визуализировать данные (Plotly, Matplotlib, Folium).
Желательно:
-
Опыт работы с городскими и пространственными данными (GIS).
-
Навыки оптимизации стоимости инференса, выбора подходящих моделей для маршрутизации задач (Model Routing) и уменьшения задержек API.
-
Понимание подходов к защите AI-систем от галлюцинаций (Guardrails).
Мы предлагаем:
-
Участие в значимом городском проекте с реальными данными Ситуационного центра.
-
Полную поддержку со стороны аналитиков и инженеров данных.
-
Чётко очерченную зону ответственности: от запроса до ответа.
-
Гибкий график работы после завершения испытательного срока.
-
Вознаграждение обсуждается индивидуально.