Data Engineer в подразделение "Премиальные решения" компании Сбер.

Обязанности:

  • Разработка, оптимизация и сопровождение масштабных ETL/ELT pipeline-процессов на Hadoop и Greenplum для обработки больших данных
  • Интеграция и объединение данных из множества внутренних и внешних источников, включая потоки данных (Kafka), в единое хранилище (Hadoop)
  • Проектирование и развитие корпоративного хранилища данных на базе Greenplum и Hadoop: создание витрин данных для аналитики и отчётности, оптимизация таблиц и запросов
  • Автоматизация и оркестрация процессов обработки данных
  • Обеспечение надежности, отказоустойчивости и качества данных: мониторинг производительности, выявление и устранение узких мест
  • Взаимодействие с бизнес- и ИТ-командами для уточнения требований и реализации проектов

Требования:

  • Опыт работы в роли Data Engineer (или аналогичной) от 2 лет
  • Уверенное владение SQL: написание сложных запросов, оптимизация производительности, понимание принципов проектирования баз данных и организации хранилищ данных
  • Практическое применение технологий Big Data: Hadoop (HDFS, YARN), Apache Spark, а также Hive, Impala или Greenplum
  • Опыт использования систем оркестрации и планировщиков задач (Apache Airflow, Oozie или аналогичные)
  • Знание инструментов контейнеризации и облачной оркестрации (Docker, Kubernetes) и опыт работы с потоковыми данными (Kafka или аналогичные платформы)
  • Понимание принципов распределенных вычислений и высоконагруженных систем
  • Английский язык на уровне для чтения технической литературы и документации

Условия: гибридная занятость.