Наша команда отвечает за контентные продукты в рамках международного развития Поиска. Например, за вертикали спорта и землетрясений для Турции. Один из основных приоритетов — развитие генеративных ответов в чатовом формате. Для этого предстоит создавать с нуля AI-ассистентов. Вы сможете влиять на новый развивающийся проект, общаться с бизнес-заказчиками, доставлять фичи до прода и быстро получать обратную связь от реальных пользователей, а затем итеративно улучшать ML-модели. Кроме этого, мы создаём полноценные поисковые сервисы, работающие под нагрузкой в тысячи запросов в секунду. Если захотите — можно получить опыт в разработке инфраструктуры, бэкенда или в улучшении качества наших сервисов.

Обязанности:

Развитие AI-ассистентов
Вам предстоит обучать большие языковые модели (LLM) генерировать ответы на запросы пользователей и поддерживать диалог. Понадобится собирать прототипы и обучающие выборки, заниматься дистилляцией тяжёлых моделей для эффективного инференса, улучшать качество ответов через цикл экспериментов с методами обучения с подкреплением (RL), а также оценивать качество моделей с помощью различных подходов. Улучшение качества наших продуктов
Вы сможете поучаствовать в каждой стадии разработки ML-продукта: от исследования пользовательских предпочтений и разработки MVP до обучения и внедрения моделей и пайплайнов в продукт. Предстоит иметь дело с разнообразными ML-инструментами и задачами: дообучать LLM-модели, улучшать ранжирование и кластеризацию, разрабатывать метрики для оценки качества продукта, а также проводить A/B-тесты с новыми фичами. Примеры направлений работы: генеративные вопросы и ответы для спортивных событий, поиск по спортивным объектам, выделение трендов в спортивной повестке. Инфраструктурные и рантаймовые задачи (при желании)
Мы регулярно запускаем крупные блоки продукта, для которых требуется реализовать ML-часть и инфраструктурные составляющие, а также оптимизировать текущие пайплайны — например, для экономии GPU или поиска баланса скорости и качества. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

  • Встраивали ML‑решения в реальные продукты
  • Хорошо знаете Python (или C++), ML и NLP
  • Знакомы с современными подходами к обучению LLM и следите за трендами в этой области

Дополнительные требования:

  • Работали с высоконагруженными сервисами
  • Разбираетесь в нейросетевых архитектурах
  • Знакомы с технологиями обработки больших данных