Хороший поиск должен не только найти релевантный документ, но и понятно представить его в выдаче. Наша команда отвечает за внешний вид документов целиком, и мы стремимся к тому, чтобы по сниппетам пользователи быстро понимали, полезен документ или нет.
Команда сниппетов пока небольшая, но именно сейчас мы переосмысливаем сниппеты и экспериментируем с новыми форматами. Построение идеального сниппета включает множество задач прикладного машинного обучения. Например, описание — это результат задачи экстрактивной суммаризации, которую мы решаем офлайн с помощью трансформеров и дистиллируем в более производительные архитектуры для высоконагруженного рантайма. Выбор уместной картинки — это задача релевантности текста и изображения, и таких задач у нас десятки.
Внутри команды присутствует дух стартапа, каждый разработчик занимается своим уникальным проектом, есть свобода для экспериментов, при этом хорошо отлажены процессы: есть стендапы, ретро и планирования. Если вы готовы решать задачи полного цикла — от формирования гипотез до выкатки улучшений в продакшен, — то будем рады видеть вас в нашей команде!
Обязанности:
Предлагать идеи и участвовать в обсуждениях новых решений
Вы будете превращать продуктовые идеи в чёткие задачи машинного обучения на стыке NLP и классического ML. Придумывать новые фичи и таргеты для источников разной природы: текстов, картинок и других.
Экспериментировать с архитектурами и внедрять решения
Понадобится экспериментировать с различными архитектурами: трансформерами (YaLM и другими), прочими нейронными сетями и бустингом, а также внедрять дистиллированные решения в высоконагруженный рантайм на C++.
Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Хорошо знаете C++ и Python
- Решали задачи в области NLP, понимаете, как работают современные подходы
- Хотите заниматься анализом данных, машинным обучением и внедрять модели в продакшен