Реклама — один из самых масштабных и технологически сложных продуктов Яндекса. Каждый день десятки нейросетей обрабатывают каждый запрос в Яндекс, выбирая из 500+ миллионов объявлений именно то, которое заинтересует пользователя, — и всё это за 200 мс. Алиса — это новый контекст для рекламы. Здесь нет поисковой строки — есть живой диалог. Наша команда строит ML-модели, которые понимают контекст разговора, намерение пользователя и подбирают объявление так, чтобы оно лучше всего дополнило ответ Алисы. Многие из задач, которые перед нами стоят, мы решаем первыми в мире. Через Яндекс Директ ежегодно растут более 600 тысяч бизнесов, и каждое наше решение напрямую влияет на их результат. Вы запускаете эксперимент, видите рост метрик и понимаете, как ваша работа меняет продукт.

Обязанности:

Разработка моделей подбора рекламы в диалоговом контексте
Алиса ведёт с пользователем живой разговор, и реклама должна органично в него вписываться. Вам предстоит проектировать и обучать модели, которые учитывают историю диалога, интент пользователя, тональность и формат взаимодействия. Вы будете работать с редакторскими, асессорскими и модельными разметками, обрабатывать большие данные, обучать тяжёлые ML-модели и преобразовывать их в легковесные модели для использования в реальном времени. Задачи на стыке RecSys и NLP
Подбор рекламы в Алисе — это полноценный рекомендательный пайплайн. На этапе кандидатогенерации нужно за миллисекунды отобрать из сотен миллионов объявлений тысячи релевантных кандидатов — здесь мы работаем с эмбеддинговыми моделями, ANN-индексами и классическими подходами рекомендательных систем. На этапе ранжирования и оценки релевантности задача становится NLP-центричной: модели должны глубоко понимать смысл диалога и текст объявления, оценивать их семантическую близость и предсказывать, насколько реклама уместна в конкретном контексте разговора. Вы сможете развиваться в обоих направлениях или сфокусироваться на том, что ближе. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

  • Знаете Python и C++
  • Базово разбираетесь в алгоритмах и структурах данных
  • Имеете опыт обучения моделей в области NLP: BERT, GPT и других
  • Знакомы с архитектурами рекомендательных систем
  • Знакомы с A/B-тестированием и умеете проводить базовую аналитику влияния своих внедрений

Дополнительные требования:

  • Занимались дистилляцией и оптимизацией моделей для real-time-инференса
  • Имеете опыт файнтюнинга генеративных моделей (RLHF, DPO)
  • Знакомы с рекламными системами или аукционными механизмами