Старший ML-разработчик агентов для Алисы

Hybrid

Full time

Middle

Москва

Deep LearningMachine LearninginferenceLangGraphreasoningreinforcement learningПроектированиеИнтеграцииFunction Callingfine-tuningразработкаtool callingИнтеграцияRetrieval-Augmented GenerationLarge Language Model

Job description

Написали своего первого агента на LangGraph и хотите перейти на следующий уровень? Мы в команде Алисы строим мультиагентную платформу, которая будет решать различные задачи миллионов пользователей — от собственной продуктивности до коммерческих сценариев. WebAgents, tool calling, (V)LLM, A/GRPO, симуляторы, хардовый R&D — это всё про нас. С видеокартами мы уже разобрались, так что ищем крутых коллег, с которыми построим успешных агентов массового пользования.

Обязанности:

Разработка и внедрение агентов на базе LLM, проектирование ML-компонентов платформы агентов
Вы будете создавать агентов, которые умеют обрабатывать сложные, multi-turn- и multi-modal-запросы пользователей. Предстоит разрабатывать системы маршрутизации задач, выбора инструментов и моделей, а также настраивать управление вызовами функций и оркестрацию различных моделей внутри пайплайна. Замена традиционных классификаторов LLM-пайплайнами и RAG-системами
Нужно будет трансформировать старые архитектуры в современные пайплайны с LLM, вызовом функций, планированием и рассуждениями. Дообучение, настройка и интеграция моделей, оптимизация inference
Вам предстоит работать как с опенсорс-моделями, так и с внутренними, включая fine-tuning, RL и адаптацию под платформу агентов. Нужно обеспечить быструю и устойчивую работу агентов на проде, включая оптимизацию inference и взаимодействие с инфраструктурой (Eagle, FP8, дистилляцию, multi-dimensional parallelism, etc.). Исследования и эксперименты с графами агентов и памятью
Мы экспериментируем с вызовами агентов, memory-подсистемами, симуляцией поведения, архитектурами reasoning и системами планирования. Участие в разработке RL-моделей для обучения диалоговых агентов
Если у вас есть опыт работы с multi-turn reinforcement learning или интерес к нему, можно будет погрузиться в постановку и реализацию таких экспериментов в масштабах Яндекса и Алисы с сотнями тулов и большим количеством тёрнов. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

Обладаете глубокими знаниями в Deep Learning и NLP
Работали с LLM и пайплайнами вокруг них (function calling, memory, RAG)
Внедряли ML-системы в продакшен
Мыслите системно — от архитектуры до интеграции с инфраструктурой
Пишете на Python, знакомы с PyTorch
Готовы к кросс-функциональной работе с бэкендом и продуктовыми командами

Match

Good match

We match every vacancy against your profile and show a fit score — so you instantly know which ones are worth applying to. Sign up and create a resume — it's free.

Not enough data to estimate a salary range for this role in this region yet.