Если вы когда-нибудь задумывались, как поисковый агент за доли секунды находит нужный товар среди миллионов предложений, собирает карточку с ценами, картинками и отзывами, — и всё это выглядит так, будто «оно само», то у нас есть хорошая новость: нам нужны именно вы, чтобы сделать это ещё лучше. Мы — часть международной команды Яндекса, которая создаёт AI-агента для турецкого рынка. Наш агент помогает найти, сравнить и выбрать продукт. Для качественного решения этой задачи мы используем различные ML-подходы: генерируем товарные карточки, сопоставляем товары от разных продавцов, классифицируем их по категориям и не только. Мы решаем задачи на стыке NLP, Computer Vision и классического ML — в продуктовом контексте и на реальном масштабе.

Обязанности:

Генерация товарных карточек
Вы будете работать над созданием удобных для пользователя карточек популярных товаров, к которым будут привязаны предложения от разных продавцов, динамика цен, изображения, отзывы и альтернативы. Обогащение визуального контента
Вам предстоит реализовать подбор разнообразных изображений товара, удаление дубликатов и фильтрацию near-duplicates. Стандартизация характеристик
Вы будете приводить товарные атрибуты к единому формату, чтобы сравнение товаров стало корректным и удобным. Классификация товаров
Вам предстоит заниматься классификацией товаров по категориям и таксономиям. Полный цикл разработки
Вы будете проходить полный цикл разработки продукта — от идеи и прототипа до внедрения в продакшен, работая с экспериментами и метриками. Больше об ML в Яндексе — в канале Yandex for ML

Ключевые навыки:

  • Глубоко понимаете основы классического ML
  • Хорошо знаете Python или C++
  • Понимаете устройство современных нейросетевых моделей для работы с текстом (трансформеры, эмбеддинги, LLM)
  • Знаете алгоритмы и структуры данных на базовом уровне
  • Готовы изучать новые технологии, предлагать идеи и доводить их до продакшена

Дополнительные требования:

  • Работали с задачами NLP или Computer Vision
  • Работали в электронной коммерции, с товарными данными или маркетплейсами
  • Знакомы с пайплайнами обработки данных на больших объёмах