Что вам предстоит делать:

Разработка и поддержка ETL/ELT-пайплайнов загрузки данных из различных источников (БД, API, файловые системы, Kafka, SAP и др.).
Развитие и сопровождение корпоративного Data Lake.
Разработка витрин данных и оптимизация процессов обработки данных.
Настройка мониторинга, логирования и контроля качества данных.
Участие в проектировании архитектурных решений и развитии платформы данных.

Что мы ожидаем от вас:

Опыт разработки и оптимизации Apache Spark/PySpark джобов для обработки больших объемов данных.
Опыт оптимизации сложных SQL запросов и трансформаций данных.
Опыт разработки ETL/ELT-процессов (Airflow, Dagster или аналогичные инструменты) и построения надежных пайплайнов загрузки данных.
Опыт проектирования и оптимизации хранения данных в S3-совместимых хранилищах (Parquet, партиционирование, управление размером файлов, оптимизация стоимости хранения).
Опыт работы с Data Lake технологиями (Iceberg, Delta Lake, Hive Metastore или аналогичными решениями).
Опыт настройки мониторинга, логирования и устранения проблем производительности в дата-пайплайнах.
Опыт работы с Git и понимание CI/CD для data pipelines

Наши условие:

Трудоустройство согласно законодательству РУз
Работу в престижном банке Узбекистана в Ташкенте
Стабильную заработную плату
Развивающаяся и взаимоуважающая команда профессионалов
Комфортные условия труда, график 5/2 с 9:00 до 18:00
Ценный и полезный опыт
Удобная локация рядом с метро
Возможность построить карьеру в престижном банке страны
Доступ к электронной библиотеке, включающую в себя огромное количество книг разных жанров, в том числе бизнес-литературу

Разработчик озера данных (Data Lake Developer)

Job description