Обязанности:
Разработка и внедрение агентов на базе LLM, проектирование ML-компонентов платформы агентовВы будете создавать агентов, которые умеют обрабатывать сложные, multi-turn- и multi-modal-запросы пользователей. Предстоит разрабатывать системы маршрутизации задач, выбора инструментов и моделей, а также настраивать управление вызовами функций и оркестрацию различных моделей внутри пайплайна. Замена традиционных классификаторов LLM-пайплайнами и RAG-системами
Нужно будет трансформировать старые архитектуры в современные пайплайны с LLM, вызовом функций, планированием и рассуждениями. Дообучение, настройка и интеграция моделей, оптимизация inference
Вам предстоит работать как с опенсорс-моделями, так и с внутренними, включая fine-tuning, RL и адаптацию под платформу агентов. Нужно обеспечить быструю и устойчивую работу агентов на проде, включая оптимизацию inference и взаимодействие с инфраструктурой (Eagle, FP8, дистилляцию, multi-dimensional parallelism, etc.). Исследования и эксперименты с графами агентов и памятью
Мы экспериментируем с вызовами агентов, memory-подсистемами, симуляцией поведения, архитектурами reasoning и системами планирования. Участие в разработке RL-моделей для обучения диалоговых агентов
Если у вас есть опыт работы с multi-turn reinforcement learning или интерес к нему, можно будет погрузиться в постановку и реализацию таких экспериментов в масштабах Яндекса и Алисы с сотнями тулов и большим количеством тёрнов. Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Обладаете глубокими знаниями в Deep Learning и NLP
- Работали с LLM и пайплайнами вокруг них (function calling, memory, RAG)
- Внедряли ML-системы в продакшен
- Мыслите системно — от архитектуры до интеграции с инфраструктурой
- Пишете на Python, знакомы с PyTorch
- Готовы к кросс-функциональной работе с бэкендом и продуктовыми командами