Обязанности:
Разработка моделей подбора рекламы в диалоговом контекстеАлиса ведёт с пользователем живой разговор, и реклама должна органично в него вписываться. Вам предстоит проектировать и обучать модели, которые учитывают историю диалога, интент пользователя, тональность и формат взаимодействия. Вы будете работать с редакторскими, асессорскими и модельными разметками, обрабатывать большие данные, обучать тяжёлые ML-модели и преобразовывать их в легковесные модели для использования в реальном времени. Задачи на стыке RecSys и NLP
Подбор рекламы в Алисе — это полноценный рекомендательный пайплайн. На этапе кандидатогенерации нужно за миллисекунды отобрать из сотен миллионов объявлений тысячи релевантных кандидатов — здесь мы работаем с эмбеддинговыми моделями, ANN-индексами и классическими подходами рекомендательных систем. На этапе ранжирования и оценки релевантности задача становится NLP-центричной: модели должны глубоко понимать смысл диалога и текст объявления, оценивать их семантическую близость и предсказывать, насколько реклама уместна в конкретном контексте разговора. Вы сможете развиваться в обоих направлениях или сфокусироваться на том, что ближе. Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Знаете Python и C++
- Базово разбираетесь в алгоритмах и структурах данных
- Имеете опыт обучения моделей в области NLP: BERT, GPT и других
- Знакомы с архитектурами рекомендательных систем
- Знакомы с A/B-тестированием и умеете проводить базовую аналитику влияния своих внедрений
Дополнительные требования:
- Занимались дистилляцией и оптимизацией моделей для real-time-инференса
- Имеете опыт файнтюнинга генеративных моделей (RLHF, DPO)
- Знакомы с рекламными системами или аукционными механизмами