Наша команда развивает еком-инструменты в международном Поиске Яндекса. Мы собираем, обрабатываем и доставляем товарные данные, которые используются в поисковых сценариях, товарной витрине и новом приложении Yandex AI. Мы работаем на стыке высоконагруженного бэкенда, распределённой обработки данных, веб-скрейпинга и продуктовой разработки. С одной стороны, развиваем инфраструктуру поставки и обработки товарных данных, с другой — помогаем запускать новые пользовательские сценарии в международном Поиске.

Обязанности:

Бороться за свежесть данных
Вам предстоит решать задачи сбора, парсинга и распознавания данных из интернета для последующей обработки. Нужно будет развивать пайплайны, которые регулярно обходят интернет-магазины и товарные витрины, извлекают актуальные данные о товарах и быстро доставляют обновления до пользовательских продуктов. Важная часть работы — повышать устойчивость таких процессов, снижать задержки и обеспечивать надёжность поставки данных. Работать над полнотой данных
Мы хотим видеть не только базовую информацию о товаре, но и всё, что делает ответ действительно полезным для пользователя. Для этого нужно улучшать извлечение и нормализацию данных, развивать конфигурации и инструменты для работы с разными источниками, а также повышать качество и покрытие товарной базы. Осваивать новые пользовательские сценарии
Ещё одна важная задача — обогащать ответы AI-агента товарными данными. Мы интегрируем веб-поиск с товарным поиском так, чтобы в диалоге с пользователем появлялись релевантные данные из интернет-магазинов. Это работа на стыке инфраструктуры, рантайма и продуктовых сценариев, где важно уметь быстро превращать идею в работающий прототип, а затем — в промышленное решение. Строить сервисы и инфраструктуру
Вы будете реализовывать части микросервисной архитектуры товарного поискового сервиса с учётом продуктовых требований к скорости, надёжности и производительности. В работе есть как онлайн-компоненты, так и офлайн-пайплайны обработки данных на MapReduce с применением распределённых очередей. Нужно будет заниматься интеграциями, API, хранением и доставкой данных, а также улучшать наблюдаемость, диагностику и эксплуатационные свойства сервисов.

Ключевые навыки:

  • Работали с брокерами сообщений
  • Пишете на С++ и Go, при этом отлично знаете один из них
  • Можете решать задачи на Python
  • Понимаете, как проектировать и развивать отказоустойчивые сервисы
  • Умеете работать с внешними источниками данных и думать о качестве, полноте и свежести данных
  • Готовы разбираться в продуктовых сценариях и доводить технические решения до продакшна

Дополнительные требования:

  • Работали с MapReduce
  • Создавали что-то на React
  • Работали в области, связанной с электронной коммерцией: в крупных интернет-магазинах, маркетплейсах, интеграторах или агрегаторах
  • Не понаслышке знаете, что такое Observability
  • Имеете опыт веб-скрейпинга, парсинга HTML-страниц или извлечения данных из нестабильных внешних источников
  • Умеете работать с товарными фидами, каталогами, ценами, отзывами или другими еком-данными
  • Проактивны и умеете самостоятельно превращать идеи в готовые технические решения