ML-разработчик в команду сниппетов (Core&Agentic Search)

Хороший поиск должен не только найти релевантный документ, но и понятно представить его в выдаче. Наша команда отвечает за внешний вид документов целиком, и мы стремимся к тому, чтобы по сниппетам пользователи быстро понимали, полезен документ или нет. Команда сниппетов пока небольшая, но именно сейчас мы переосмысливаем сниппеты и экспериментируем с новыми форматами. Построение идеального сниппета включает множество задач прикладного машинного обучения. Например, описание — это результат задачи экстрактивной суммаризации, которую мы решаем офлайн с помощью трансформеров и дистиллируем в более производительные архитектуры для высоконагруженного рантайма. Выбор уместной картинки — это задача релевантности текста и изображения, и таких задач у нас десятки. Внутри команды присутствует дух стартапа, каждый разработчик занимается своим уникальным проектом, есть свобода для экспериментов, при этом хорошо отлажены процессы: есть стендапы, ретро и планирования. Если вы готовы решать задачи полного цикла — от формирования гипотез до выкатки улучшений в продакшен, — то будем рады видеть вас в нашей команде!

Обязанности:

Предлагать идеи и участвовать в обсуждениях новых решений
Вы будете превращать продуктовые идеи в чёткие задачи машинного обучения на стыке NLP и классического ML. Придумывать новые фичи и таргеты для источников разной природы: текстов, картинок и других. Экспериментировать с архитектурами и внедрять решения
Понадобится экспериментировать с различными архитектурами: трансформерами (YaLM и другими), прочими нейронными сетями и бустингом, а также внедрять дистиллированные решения в высоконагруженный рантайм на C++. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

Хорошо знаете C++ и Python
Решали задачи в области NLP, понимаете, как работают современные подходы
Хотите заниматься анализом данных, машинным обучением и внедрять модели в продакшен

Job description

Match