Data Engineer в подразделение "Премиальные решения" компании Сбер.
Обязанности:
- Разработка, оптимизация и сопровождение масштабных ETL/ELT pipeline-процессов на Hadoop и Greenplum для обработки больших данных
- Интеграция и объединение данных из множества внутренних и внешних источников, включая потоки данных (Kafka), в единое хранилище (Hadoop)
- Проектирование и развитие корпоративного хранилища данных на базе Greenplum и Hadoop: создание витрин данных для аналитики и отчётности, оптимизация таблиц и запросов
- Автоматизация и оркестрация процессов обработки данных
- Обеспечение надежности, отказоустойчивости и качества данных: мониторинг производительности, выявление и устранение узких мест
- Взаимодействие с бизнес- и ИТ-командами для уточнения требований и реализации проектов
Требования:
- Опыт работы в роли Data Engineer (или аналогичной) от 2 лет
- Уверенное владение SQL: написание сложных запросов, оптимизация производительности, понимание принципов проектирования баз данных и организации хранилищ данных
- Практическое применение технологий Big Data: Hadoop (HDFS, YARN), Apache Spark, а также Hive, Impala или Greenplum
- Опыт использования систем оркестрации и планировщиков задач (Apache Airflow, Oozie или аналогичные)
- Знание инструментов контейнеризации и облачной оркестрации (Docker, Kubernetes) и опыт работы с потоковыми данными (Kafka или аналогичные платформы)
- Понимание принципов распределенных вычислений и высоконагруженных систем
- Английский язык на уровне для чтения технической литературы и документации
Условия: гибридная занятость.