Обязанности:
Улучшение базового качества диалога для достижения образовательных целейВы будете улучшать качество диалогового взаимодействия модели с пользователем: строить гипотезы, экспериментировать с архитектурами, данными и схемами обучения, анализировать ошибки и внедрять улучшения. Фокус — сложные пользовательские запросы, неоднозначные формулировки и образовательные сценарии, которые требуют глубокого понимания контекста и предметной области. Построение архитектуры продуктовой ML-системы
Вам предстоит разрабатывать ML-часть AI-тьютора как полноценного продукта: совместно с менеджерами продукта формировать требования и метрики качества, проектировать и развивать ML-пайплайн обучения, оценки и аналитики, а также отвечать за релизы, A/B-эксперименты и интеграцию моделей в сервисы Яндекса (например, Яндекс Репетитор AI, Алиса). Исследования в области LLM
Мы активно используем современные NLP-подходы и большие языковые модели. Вы будете дообучать и адаптировать LLM под образовательные сценарии, работать с алайнментом моделей и контролем качества ответов, применять и развивать подходы RAG, function calling, сценарное управление диалогом. Создание инфраструктуры обучения, адаптация к условиям продакшена
Вам предстоит участвовать в создании инфраструктуры для обучения и экспериментов с моделями, а также в адаптации решений под продакшен-ограничения. Это включает оптимизацию latency и стоимости инференса, масштабирование real-time-сервисов с высокой нагрузкой, обучение LLM-агентов и разработку среды, в которой агенты могут симулировать диалоги между преподавателем и учеником для тестирования и улучшения системы. Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Уверенно владеете Python и работали с PyTorch
- Знакомы с основами обучения LLM
- Работали с vLLM для развёртывания LLM
- Обладаете крепкой базой знаний в ML
Дополнительные требования:
- Работали с DL в области речевых технологий
- Внедряли нейросетевые модели в продакшен
- Работали с большими данными