В Яндексе существует множество вертикальных поисков: товары, путешествия, недвижимость, афиша, музыка. У каждого из них своя логика ранжирования, метрики качества и интеграции с продуктами вроде Алисы. Мы хотим собрать из этого единую платформу поиска, где команды смогут описывать требования к релевантности и интеграциям декларативно, а инфраструктура будет автоматически строить ранжирование, evaluation и подключение к агентам. В основе платформы — современные LLM и ML-подходы: от компиляции политик релевантности до дистилляции моделей ранжирования и стандартных интерфейсов для агентов.

Обязанности:

Развивать платформу поиска для продуктовых команд
Вы будете реализовывать ML-инфраструктуру, которую смогут использовать десятки команд внутри компании. Платформа должна позволять быстро запускать новые поиски и экспериментировать с логикой ранжирования. Использовать LLM для построения ML-пайплайнов
Мы применяем LLM для описания логики ранжирования, генерации обучающих данных и помощи в настройке моделей. Вам предстоит реализовать такие механизмы внутри платформы. Заниматься дистилляцией моделей ранжирования
Нужно будет превращать тяжёлые мощные модели в быстрые продакшн-модели, позволяющие соблюдать ограничения по латентности и не сильно уступающие в качестве учителю. Развивать систему метрик и evaluation
Вы будете создавать инфраструктуру для измерения качества поиска в разных вертикалях. Это включает метрики, офлайн-evaluation и поддержку экспериментов. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

  • Обучали LLM или BERT-модели
  • Уверенно владеете Python и работаете с SQL
  • Увлечены ML, аналитикой и интеграцией моделей в реальные сервисы
  • Хорошо разбираетесь в алгоритмах и структурах данных

Дополнительные требования:

  • Работали с поиском или рекомендациями