Яндекс Образование создаёт образовательные продукты для школьников, родителей и учителей, а также инструменты для всего образовательного сообщества. Мы разрабатываем технологичные решения, включая AI-инструменты, которые помогают детям осваивать IT-навыки, учиться эффективнее и получать современное образование, а взрослым — лучше понимать и сопровождать этот процесс. Наша стратегическая цель — создать интеллектуального AI-репетитора: диалоговую систему, которая умеет вести осмысленный учебный диалог, оценивать уровень знаний, находить пробелы, объяснять сложные темы и формировать персональные рекомендации по обучению. Мы ищем ML-разработчика с сильным бэкграундом в NLP и LLM, который будет участвовать в создании и развитии такого тьютора: от исследований и экспериментов до продакшен-систем, обслуживающих сотни тысяч пользователей.

Обязанности:

Улучшение базового качества диалога для достижения образовательных целей
Вы будете улучшать качество диалогового взаимодействия модели с пользователем: строить гипотезы, экспериментировать с архитектурами, данными и схемами обучения, анализировать ошибки и внедрять улучшения. Фокус — сложные пользовательские запросы, неоднозначные формулировки и образовательные сценарии, которые требуют глубокого понимания контекста и предметной области. Построение архитектуры продуктовой ML-системы
Вам предстоит разрабатывать ML-часть AI-тьютора как полноценного продукта: совместно с менеджерами продукта формировать требования и метрики качества, проектировать и развивать ML-пайплайн обучения, оценки и аналитики, а также отвечать за релизы, A/B-эксперименты и интеграцию моделей в сервисы Яндекса (например, Яндекс Репетитор AI, Алиса). Исследования в области LLM
Мы активно используем современные NLP-подходы и большие языковые модели. Вы будете дообучать и адаптировать LLM под образовательные сценарии, работать с алайнментом моделей и контролем качества ответов, применять и развивать подходы RAG, function calling, сценарное управление диалогом. Создание инфраструктуры обучения, адаптация к условиям продакшена
Вам предстоит участвовать в создании инфраструктуры для обучения и экспериментов с моделями, а также в адаптации решений под продакшен-ограничения. Это включает оптимизацию latency и стоимости инференса, масштабирование real-time-сервисов с высокой нагрузкой, обучение LLM-агентов и разработку среды, в которой агенты могут симулировать диалоги между преподавателем и учеником для тестирования и улучшения системы. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

  • Уверенно владеете Python и работали с PyTorch
  • Знакомы с основами обучения LLM
  • Работали с vLLM для развёртывания LLM
  • Обладаете крепкой базой знаний в ML

Дополнительные требования:

  • Работали с DL в области речевых технологий
  • Внедряли нейросетевые модели в продакшен
  • Работали с большими данными