Проект: банк. Репликация данных из источников в распределенный облачный кластер и индексирование данных для обработки запросов в режиме реального времени.

Требования:

Базовый уровень знания Java (циклы, условия, хешмапы и т.д.).
Базовый уровень знания и понимание CI/CD.
Linux (basic), Ansible, SQL, Git, XML, JSON, XSLT, YAML.
Базовые знания экосистемы Hadoop и его компонентов: Apache Solr, Apache Hive, Apache HBase, Apache Spark, Apache Zookeeper, Apache Oozie, Apache Camel.
Английский: технический (чтение документации).

Задачи:

Репликация и индексирование данных из различных источников (в основном Apache Hive) в распределенный облачный кластер.
Обеспечение обработки запросов в режиме реального времени через REST или брокеры сообщений (Kafka или IBM MQ).

Условия: удаленная работа, фулл тайм. Локация: РФ, РБ.

Стек/инструменты: JIRA, Confluence, корпоративные мессенджеры, Outlook, Scrum.

Data Engineer

Job description

Match

Estimated salary