Обязанности:
Проектирование и развитие высоконагруженного мультиагентного сервисаТысячи коллег решают рабочие задачи с помощью агентов, которых мы создаём. Наш сервис должен выдерживать нагрузку даже в пиковые часы, гарантируя стабильность и скорость ответа. Нужно будет оптимизировать работу GPU-инференса, ускорять стриминг, писать высокоэффективный и поддерживаемый код, быстро разбираться в ошибках и стабилизировать сервис. Развитие мультиагентной системы
Мы интегрированы во множество компонент внутренней инфраструктуры Яндекса. Для каждой компоненты реализован агент, глубоко знающий доменную область. Однако задачи, которые мы решаем каждый день, могут находиться на стыке доменов. Поэтому нужно развивать систему взаимодействия агентов, чтобы максимально качественно решить задачу пользователя. Развитие системы метрик и создание контуров замера
Метрики — наше всё! По мере развития ассистента необходимо внедрять новые метрики, оценивающие новые аспекты качества. Также нужно изменять метрики, чтобы учитывать новые пользовательские сценарии и уточнять старые. Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Работали с ML-моделями (NLP, IR)
- Умеете планировать эксперименты и знаете, как измерить их успех
- Умеете писать продакшен-код на Python
- Знакомы с MapReduce, обработка терабайтов логов вас не пугает
Дополнительные требования:
- Проектировали и разрабатывали агентские системы
