Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 2500+ специалистов. Мы разрабатываем программное обеспечение и IT-решения в сферах Finance, Healthcare, eCommerce, IoT, Media, Big Data, ML и многом другом.

Предлагаем присоединиться в роли Data Engineer!

Заказчик — это ведущий российский ритейлер, который активно развивает онлайн-направление и собственную логистику, сохраняя лидерство в продуктовом ритейле.

Почему это будет интересно?

Требования:

  • опыт работы в роли Data Engineer от 3-х лет;
  • опыт работы с PySpark, навыки оптимизации: broadcast join, bucketing, partitioning, борьба с data skew, настройка параллелизма;
  • знание Spark SQL: сложные аналитические запросы, опыт работы с объемами 100+ млн строк ежедневно;
  • знание HDFS / S3. Trino. Форматы: ORC / Parquet / Iceberg.
  • знание Apache Airflow, опыт написания DAGов, сенсоры, retries, SLA, backfill;
  • знание Python 3;
  • отличные знания Pandas, NumPy;
  • знания SQL и РСУБД
  • понимание Kubernetes, YARN.

Обязанности:

  • разрабатывать и оптимизировать Spark-пайплайны для обработки данных в масштабе (200+ млн строк ежедневно);
  • настраивать хранение и доступность данных в DWH;
  • автоматизировать интеграцию данных: продажи, акции, цены, остатки, погода, календари;
  • работать в связке с Data Science-командой, обеспечивая стабильный и качественный поток данных для моделей;
  • принимать участие в развитии платформы прогнозирования спроса, делая ее более надежной, масштабируемой и удобной.