Что вам предстоит делать:
- Разработка и поддержка ETL/ELT-пайплайнов загрузки данных из различных источников (БД, API, файловые системы, Kafka, SAP и др.).
- Развитие и сопровождение корпоративного Data Lake.
- Разработка витрин данных и оптимизация процессов обработки данных.
- Настройка мониторинга, логирования и контроля качества данных.
- Участие в проектировании архитектурных решений и развитии платформы данных.
Что мы ожидаем от вас:
- Опыт разработки и оптимизации Apache Spark/PySpark джобов для обработки больших объемов данных.
- Опыт оптимизации сложных SQL запросов и трансформаций данных.
- Опыт разработки ETL/ELT-процессов (Airflow, Dagster или аналогичные инструменты) и построения надежных пайплайнов загрузки данных.
- Опыт проектирования и оптимизации хранения данных в S3-совместимых хранилищах (Parquet, партиционирование, управление размером файлов, оптимизация стоимости хранения).
- Опыт работы с Data Lake технологиями (Iceberg, Delta Lake, Hive Metastore или аналогичными решениями).
- Опыт настройки мониторинга, логирования и устранения проблем производительности в дата-пайплайнах.
- Опыт работы с Git и понимание CI/CD для data pipelines
Наши условие:
- Трудоустройство согласно законодательству РУз
- Работу в престижном банке Узбекистана в Ташкенте
- Стабильную заработную плату
- Развивающаяся и взаимоуважающая команда профессионалов
- Комфортные условия труда, график 5/2 с 9:00 до 18:00
- Ценный и полезный опыт
- Удобная локация рядом с метро
- Возможность построить карьеру в престижном банке страны
- Доступ к электронной библиотеке, включающую в себя огромное количество книг разных жанров, в том числе бизнес-литературу