ML-разработчик в группу релевантности рекламы

Офис

Полная

Middle

Санкт-Петербург

PythonMachine LearningBERTC++dpoGPTNatural Language ProcessingRecSysrlhfМикросервисыyandexБольшие данныеРазработкаЯндекс

Описание вакансии

Реклама — один из самых масштабных и технологически сложных продуктов Яндекса. Каждый день десятки нейросетей обрабатывают каждый запрос в Яндекс, выбирая из 500+ миллионов объявлений именно то, которое заинтересует пользователя, — и всё это за 200 мс. Алиса — это новый контекст для рекламы. Здесь нет поисковой строки — есть живой диалог. Наша команда строит ML-модели, которые понимают контекст разговора, намерение пользователя и подбирают объявление так, чтобы оно лучше всего дополнило ответ Алисы. Многие из задач, которые перед нами стоят, мы решаем первыми в мире. Через Яндекс Директ ежегодно растут более 600 тысяч бизнесов, и каждое наше решение напрямую влияет на их результат. Вы запускаете эксперимент, видите рост метрик и понимаете, как ваша работа меняет продукт.

Обязанности:

Разработка моделей подбора рекламы в диалоговом контексте
Алиса ведёт с пользователем живой разговор, и реклама должна органично в него вписываться. Вам предстоит проектировать и обучать модели, которые учитывают историю диалога, интент пользователя, тональность и формат взаимодействия. Вы будете работать с редакторскими, асессорскими и модельными разметками, обрабатывать большие данные, обучать тяжёлые ML-модели и преобразовывать их в легковесные модели для использования в реальном времени. Задачи на стыке RecSys и NLP
Подбор рекламы в Алисе — это полноценный рекомендательный пайплайн. На этапе кандидатогенерации нужно за миллисекунды отобрать из сотен миллионов объявлений тысячи релевантных кандидатов — здесь мы работаем с эмбеддинговыми моделями, ANN-индексами и классическими подходами рекомендательных систем. На этапе ранжирования и оценки релевантности задача становится NLP-центричной: модели должны глубоко понимать смысл диалога и текст объявления, оценивать их семантическую близость и предсказывать, насколько реклама уместна в конкретном контексте разговора. Вы сможете развиваться в обоих направлениях или сфокусироваться на том, что ближе. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

Знаете Python и C++
Базово разбираетесь в алгоритмах и структурах данных
Имеете опыт обучения моделей в области NLP: BERT, GPT и других
Знакомы с архитектурами рекомендательных систем
Знакомы с A/B-тестированием и умеете проводить базовую аналитику влияния своих внедрений

Дополнительные требования:

Занимались дистилляцией и оптимизацией моделей для real-time-инференса
Имеете опыт файнтюнинга генеративных моделей (RLHF, DPO)
Знакомы с рекламными системами или аукционными механизмами

Хорошее соответствие

Мы сравниваем каждую вакансию с вашим профилем и показываем процент соответствия — чтобы вы сразу видели, куда стоит откликнуться. Авторизуйтесь и создайте резюме — это бесплатно.

Пока недостаточно данных, чтобы оценить зарплатную вилку для этой роли в этом регионе.