ОСНОВНЫЕ ЗАДАЧИ:
- Разрабатывать и реализовывать мероприятия по процессу управления качеством данных;
- Разрабатывать и внедрять Data Quality тесты: написание Data Quality правил (SQL, Python, dbt, и др.);
- Автоматизация контроля качества: настройка пайплайнов для запуска Data Quality проверок в CI/CD или в Airflow.
- Профилирование данных End 2 End;
- Выявление, классифицирование и по возможности устранение ошибок и аномалии в данных (дубликаты, пропуски, несогласованность).
- Мониторинг и алертинг: интеграция систем наблюдаемости (Grafana, OpenMetadata, Data Governance Platform и др.);
- Обработка аномалий: выявление ошибок (дубликаты, пропуски, несогласованность) и настройка автоматической валидации;
- Интеграция с DWH/BI/Data Source;
- Документирование Data Quality правил: фиксация правил качества, бизнес-правил и технической логики в каталогах/репозиториях;
- Поддержка CI/CD практик: хранение и версионирование Data Quality правил (Git), автоматический запуск тестов при изменении кода/данных;
- Участие в разработке стандартов качества данных и интеграции их в процессы компании;
- Взаимодействие с владельцами и кураторами данных, архитекторами, аналитиками, инженерами для согласования требований к качеству данных; Поддержка функциональной части и настраивать OpenMetadata, Data Governance Platform;
- Участие в миграции данных в Data Governance Platform из OpenMetadata/DWH/ClickHouse.
НАС ИНТЕРЕСУЕТ:
- Опыт работы с инструментами контроля качества данных (Пример, Informatica Developer, Talent DQ, Ataccama DQ, SAP Data Services, Qlik Catalyst, и другие) будет преимуществом;
- Опыт работы с Data Observability будет преимуществом;
- Опыт формирования метрик для измерения качества данных;
- Опыт профилирования и очистки данных;
- Опыт разработки и настройки алгоритмов валидации данных, проверок качества данных;
- Знание принципов управления данными, жизненного цикла данных;
- Понимание основных принципов и паттернов проектирования микросервисной архитектуры;
- Навыки структурирования информации и упрощения, верификации знаний;
- Опыт разработки процессов управления качеством данных будет преимуществом;
- Опыт работы с Jira / Confluence;
- Понимание по архитектуре: REST, SOA, API;
- Структура данных: JSON, XML, WSDL, XSD;
- Понимание принципов работы: DWH/ETL/ELT;
- Владение SQL (ClickHouse, Oracle, PostgreSQL, MySQL) на продвинутом уровне;
- Опыт развертывания и сопровождения сервисов через Docker Compose (Metadata solutions, Airflow, Kafka, Postgres, dbt и др.).
ЗАРПЛАТА - ЭТО ЕЩЕ НЕ ВСЁ:
- Гибридный формат работы и гибкое начало рабочего дня;
- Профессиональное развитие: участие в митапах, тренингах, конференциях, демо-днях и хакатонах;
- Дополнительные 4 дня отпуска — итого 28 календарных дней за год;
- Годовой бонус по результатам достижения KPI;
- Корпоративная сотовая связь;
- Добровольная медицинская страховка со стоматологией и лекарствами с возможностью бесплатно добавить двух близких родственников;
- Фитнес-абонементы со скидкой и в рассрочку;
- Онлайн-платформа бесплатной психологической помощи;
- Доступ к корпоративной онлайн-библиотеке MyBook.
Теlе2 — это территория возможностей. Здесь тебя примут таким, какой ты есть, поддержат, направят и откроют множество возможностей.