НОЦ "Технологии искусственного интеллекта" на базе МГТУ им. Н.Э. Баумана приглашает Lead Data Scientist (LLM).
На базе Центра ведется разработка и внедрение масштабных проектов с применением искусственного интеллекта для крупных федеральных заказчиков, реализуются проекты разработки для коммерческого сектора, а также наукоемкие проекты.
Ваши задачи:
- Организация работы команды и управление DS направления LLM по закрепленным проектам.
- Планирование, декомпозиция задач, приоритизация и распределение работы внутри команды.
- Обеспечение и контроль выполнения задач в срок без потери качества
- Участие в формировании команды разработки.
- Развитие команды: менторство, онбординг, повышение уровня самостоятельности разработчиков.
- Проведение code review. выявление и исправление архитектурных и логических ошибок в процессе разработки.
- Проектирование и реализация LLM‑решений для прикладных сценариев: QA‑ассистенты, поиск по документам, аналитические помощники, классификация/извлечение сущностей и др. (основной фокус — NLP/LLM).
- Подбор наиболее эффективных инструментов для реализации LLM‑решений.
- Построение RAG‑пайплайнов: подготовка и чанкинг данных, индексация, retrieval (в т.ч. с фильтрами), rerank, генерация ответа, обработка “no answer”.
- Адаптация моделей под домен: prompt‑engineering, SFT/LoRA (или другие подходы fine‑tuning), подбор датасета/разметки, анализ ошибок и итерации.
- Разработка и поддержание агентных сценариев: function calling, tool-use, оркестрация шагов, контроль ограничений/политик, обработка исключений, оценка надежности.
- Построение системы оценки качества: офлайн‑метрики, тест‑наборы, протоколы human‑eval, интерпретация результатов и план улучшений.
- Участие в выводе в прод: прототип → сервис → мониторинг качества/latency/cost, участие в разборе деградаций и регрессий.
- Изучение документации/репозиториев и поиск решений на основе best practices с учетом ограничений инфраструктуры.
Мы ожидаем от Вас:
- Высшее техническое образование в области ИТ и /или повышение квалификации в области Data Science.
- Опыт работы на лидирующей позиции в области DS, навыки менторства и онбординга.
- Владение Python и основными ML-библиотеками (Pandas, Sklearn, Tensorflow, Keras, PyTorch, XGBoost или аналоги).
- Понимание классического ML и базовых архитектур нейросетей; умение выбирать метрики и интерпретировать результаты.
- Опыт работы с NLP-библиотеками: pymorphy2, NLTK, spaCy, regex.
- Опыт работы с LLM, prompt-engineering, fine-tuning, RAG, MCP.
- Опыт работы с Hugging Face Transformers.
- Опыт работы с vLLM.
- Опыт работы с векторными БД (Qdrant или аналогами).
Приветствуется:
- Научно-исследовательский опыт, умение оформлять результаты (заметки, отчеты, статьи).
- Git (GitLab), FastAPI, Docker/Docker Compose; базовые навыки деплоя и эксплуатации сервисов.
- MLOps практики (эксперименты, трекинг, модели/датасеты, мониторинг), SQL.
- Kafka/Spark/Hadoop (если есть большие потоки/батчи данных).
- Helm, k9s и опыт работы с Kubernetes окружением.
- UML (как инструмент коммуникации с командой разработки/аналитики).
Мы предлагаем Вам:
- Работа в IT- Центре на базе МГТУ им. Н.Э.Баумана.
- Амбициозные и интересные задачи.
- Возможность дополнительного обучения по программам повышения квалификации.
- Возможность повышения академического уровня знаний (аспирантура и докторантура).
- Оформление по ТК РФ.
- Полная занятость, гибридный график, возможен удаленный формат работы для жителей Москвы и МО.
- Удобный офис в пешей доступности от станции метро Бауманская.
- Лидерскую роль в направлении интеграции AI-технологий.
- Заработная плата обсуждается по результатам собеседования.