Обязанности:
Бороться за свежесть данныхВам предстоит решать задачи сбора, парсинга и распознавания данных из интернета для последующей обработки. Нужно будет развивать пайплайны, которые регулярно обходят интернет-магазины и товарные витрины, извлекают актуальные данные о товарах и быстро доставляют обновления до пользовательских продуктов. Важная часть работы — повышать устойчивость таких процессов, снижать задержки и обеспечивать надёжность поставки данных. Работать над полнотой данных
Мы хотим видеть не только базовую информацию о товаре, но и всё, что делает ответ действительно полезным для пользователя. Для этого нужно улучшать извлечение и нормализацию данных, развивать конфигурации и инструменты для работы с разными источниками, а также повышать качество и покрытие товарной базы. Осваивать новые пользовательские сценарии
Ещё одна важная задача — обогащать ответы AI-агента товарными данными. Мы интегрируем веб-поиск с товарным поиском так, чтобы в диалоге с пользователем появлялись релевантные данные из интернет-магазинов. Это работа на стыке инфраструктуры, рантайма и продуктовых сценариев, где важно уметь быстро превращать идею в работающий прототип, а затем — в промышленное решение. Строить сервисы и инфраструктуру
Вы будете реализовывать части микросервисной архитектуры товарного поискового сервиса с учётом продуктовых требований к скорости, надёжности и производительности. В работе есть как онлайн-компоненты, так и офлайн-пайплайны обработки данных на MapReduce с применением распределённых очередей. Нужно будет заниматься интеграциями, API, хранением и доставкой данных, а также улучшать наблюдаемость, диагностику и эксплуатационные свойства сервисов.
Ключевые навыки:
- Работали с брокерами сообщений
- Пишете на С++ и Go, при этом отлично знаете один из них
- Можете решать задачи на Python
- Понимаете, как проектировать и развивать отказоустойчивые сервисы
- Умеете работать с внешними источниками данных и думать о качестве, полноте и свежести данных
- Готовы разбираться в продуктовых сценариях и доводить технические решения до продакшна
Дополнительные требования:
- Работали с MapReduce
- Создавали что-то на React
- Работали в области, связанной с электронной коммерцией: в крупных интернет-магазинах, маркетплейсах, интеграторах или агрегаторах
- Не понаслышке знаете, что такое Observability
- Имеете опыт веб-скрейпинга, парсинга HTML-страниц или извлечения данных из нестабильных внешних источников
- Умеете работать с товарными фидами, каталогами, ценами, отзывами или другими еком-данными
- Проактивны и умеете самостоятельно превращать идеи в готовые технические решения