Мы в команде функций Алисы разрабатываем LLM, которая способна работать с сотнями различных инструментов. Это позволяет делать Алису умнее и работать во множестве сложных сценариев: продуктивности, управлении умным домом, поиске контента, погоде и много где ещё! Чем мы занимаемся * Исследуем подходы к улучшению качества в tool-calling-сценариях * Совершенствуем SFT-стадию * Делаем RL * Расширяем возможности Алисы для миллионов пользователей С видеокартами мы уже разобрались, так что ищем крутых коллег, с которыми построим по-настоящему умного ассистента.

Обязанности:

Разработка и внедрение в устройства с Алисой новых сценариев на базе LLM
Вы будете обучать LLM решать задачи пользователя в сложных сценариях, которые возникают при взаимодействии с устройствами и умным домом. Предстоит совершенствовать выбор необходимых функций, улучшать способности LLM работать со сложным контекстом и вызывать цепочки функций для решения задачи пользователя, создавать для этого RL-среды и подходы к генерации данных. Замена традиционных классификаторов LLM-пайплайнами и RAG-системами
Вы будете трансформировать существующие архитектуры в современные пайплайны с LLM, вызовом функций, планированием и рассуждениями. Дообучение, настройка и интеграция моделей, оптимизация inference
Вам предстоит работать как с опенсорс-моделями, так и с внутренними, включая fine-tuning, RL и адаптацию под платформу Алисы. Нужно обеспечить быструю и устойчивую работу моделей на проде, включая оптимизацию inference и взаимодействие с инфраструктурой (Eagle, FP8, дистилляцию, etc.). Участие в разработке RL-моделей для обучения диалоговых агентов
Если у вас есть опыт работы с multi-turn reinforcement learning или интерес к нему, можно будет погрузиться в постановку и реализацию таких экспериментов в масштабах Яндекса и Алисы с сотнями тулов и большим количеством тёрнов. Работа в большой кросс-функциональной команде
Делать Алису лучше нам помогает большая команда, состоящая из аналитики, бэкенда и продукта. Вам предстоит строить взаимодействия, прорабатывать системы бенчмаркинга моделей совместно с аналитикой и обсуждать варианты реализаций функций, подходящих для LLM-пайплайнов. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

  • Обладаете глубокими знаниями в Deep Learning и NLP
  • Работали с LLM и пайплайнами вокруг них (function calling, memory, RAG)
  • Внедряли ML-системы в продакшен
  • Мыслите системно — от архитектуры до интеграции с инфраструктурой
  • Пишете на Python, знакомы с PyTorch
  • Готовы к кросс-функциональной работе с бэкендом, аналитикой и продуктовыми командами