Саджест (поисковые подсказки) — один из самых востребованных сервисов Яндекса. Мы отдаём более 100 тысяч запросов в секунду, и 99,9% из них — меньше чем за 100 мс. Каждый день более 100 миллионов пользователей отправляют запросы в саджест. Ищем разработчика, который поможет нам внедрить современные технологии машинного обучения и улучшить инфраструктуру высоконагруженного сервиса. Вы познакомитесь с нашими архитектурными и программными решениями и сможете внедрить собственные.

Обязанности:

Развитие AI-саджеста
Мы переосмысляем роль саджеста в новом мире чата с Алисой и гонки ИИ. Вы будете придумывать и внедрять новые ассистентские подсказки, в том числе с использованием LLM. Разработка генеративного саджеста
Вам предстоит обучать маленькие LLM для генерации подсказок и исправления запросов пользователей. Вы будете строить пайплайны обработки данных и конвейеризовать обучение моделей. ML в высоконагруженных сервисах
Вы будете решать ML-задачи на огромном потоке, искать компромиссы и оптимизировать. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

  • Применяли алгоритмы машинного обучения на практике
  • Обладаете широким кругозором в современном NLP
  • Разбираетесь в классических алгоритмах и структурах данных

Дополнительные требования:

  • Занимались многопоточным и сетевым программированием
  • Имеете опыт разработки на объектно-ориентированных языках программирования
  • Пишете на C++ и знакомы с Linux