Обязанности:
Разработка и внедрение в устройства с Алисой новых сценариев на базе LLMВы будете обучать LLM решать задачи пользователя в сложных сценариях, которые возникают при взаимодействии с устройствами и умным домом. Предстоит совершенствовать выбор необходимых функций, улучшать способности LLM работать со сложным контекстом и вызывать цепочки функций для решения задачи пользователя, создавать для этого RL-среды и подходы к генерации данных. Замена традиционных классификаторов LLM-пайплайнами и RAG-системами
Вы будете трансформировать существующие архитектуры в современные пайплайны с LLM, вызовом функций, планированием и рассуждениями. Дообучение, настройка и интеграция моделей, оптимизация inference
Вам предстоит работать как с опенсорс-моделями, так и с внутренними, включая fine-tuning, RL и адаптацию под платформу Алисы. Нужно обеспечить быструю и устойчивую работу моделей на проде, включая оптимизацию inference и взаимодействие с инфраструктурой (Eagle, FP8, дистилляцию, etc.). Участие в разработке RL-моделей для обучения диалоговых агентов
Если у вас есть опыт работы с multi-turn reinforcement learning или интерес к нему, можно будет погрузиться в постановку и реализацию таких экспериментов в масштабах Яндекса и Алисы с сотнями тулов и большим количеством тёрнов. Работа в большой кросс-функциональной команде
Делать Алису лучше нам помогает большая команда, состоящая из аналитики, бэкенда и продукта. Вам предстоит строить взаимодействия, прорабатывать системы бенчмаркинга моделей совместно с аналитикой и обсуждать варианты реализаций функций, подходящих для LLM-пайплайнов. Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Обладаете глубокими знаниями в Deep Learning и NLP
- Работали с LLM и пайплайнами вокруг них (function calling, memory, RAG)
- Внедряли ML-системы в продакшен
- Мыслите системно — от архитектуры до интеграции с инфраструктурой
- Пишете на Python, знакомы с PyTorch
- Готовы к кросс-функциональной работе с бэкендом, аналитикой и продуктовыми командами