Современная поисковая выдача — это не просто список ссылок, а умная экосистема тематических блоков, которая помогает пользователям находить ответы быстрее и точнее. Команда Блендера отвечает за то, чтобы поисковые модели правильно интерпретировали намерения: должен ли показываться блок погоды по запросу «пагода»? А нужно ли выводить видео по запросу «гаечный ключ на 14”»? Для этого мы соединяем онлайн- и офлайн-сигналы, обучаем мощные ML-системы и делаем поиск умнее.

Обязанности:

Обучать модели на разные сигналы
Блендер оптимизирует разные сигналы, например онлайн (клики, сессии и т. п.) и офлайн (оценку релевантности). Нужно обучать модель на смесь этих сигналов и искать баланс. Подбирать метрику качества
Мы пытаемся определить, нашёл ли пользователь ответ на свой вопрос, на основе истории кликов и запросов. Это сложная задача, которая требует постоянных улучшений. Нужно вместе с аналитиками подобрать таргет, чтобы обучение под него улучшало пользовательский опыт и растило сессии. Переходить с классического ML на LLM
Мы активно используем разные LLM, BERT и другое NLP, но финальное решение всё ещё принимают катбусты. Работаем над полным переходом на LLM & RL и предлагаем присоединиться к этой большой стройке. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

  • Работали с классическими моделями или NLP
  • Уверенно владеете Python и работаете с SQL, знание C++ также будет плюсом
  • Увлечены ML, аналитикой и интеграцией моделей в реальные сервисы
  • Хорошо разбираетесь в алгоритмах и структурах данных