Обязанности:
Усиление базового стекаМы регулярно улучшаем базовые нейротехнологии, заимствуем опенсорс-решения, адаптируем к нашим реалиям и делаем их лучше. Вам предстоит прокачивать CLIP архитектуры, извлекать профит из последних VLM, искать способы лучше понимать изображение через текст и многое другое. Усиление веб-релевантности
Хоть наш сервис в первую очередь предназначен для поиска визуального контента, пользователям также важно находить нужные источники. Вы будете разрабатывать нейросети с учётом как картиночной, так и текстовой модальностей для предсказания веб-релевантности. Эксперименты с особенно сложными запросами
Классические модели ранжирования позволяют решать большую часть поисковых сценариев. Но всегда существует узкий класс сложных запросов, на которых даже асессоры будут ошибаться. Для улучшения качества на таком срезе запросов мы открыты к самым смелым экспериментам: от мультиагентных систем до обучения с подкреплением классических моделей ранжирования.
Больше об ML в Яндексе — в канале Yandex for ML
Ключевые навыки:
- Решали продуктовые ML-задачи: от сбора данных до деплоя модели
- Работали с дискриминативными NLP-моделями
- Понимаете, как работает ранжирование / рекомендательные системы
- Владеете Python и C++
Дополнительные требования:
- Работали с retrieval/reranking
- Понимаете устройство современных VLM
