Проект: банк. Репликация данных из источников в распределенный облачный кластер и индексирование данных для обработки запросов в режиме реального времени.
Требования:
- Базовый уровень знания Java (циклы, условия, хешмапы и т.д.).
- Базовый уровень знания и понимание CI/CD.
- Linux (basic), Ansible, SQL, Git, XML, JSON, XSLT, YAML.
- Базовые знания экосистемы Hadoop и его компонентов: Apache Solr, Apache Hive, Apache HBase, Apache Spark, Apache Zookeeper, Apache Oozie, Apache Camel.
- Английский: технический (чтение документации).
Задачи:
- Репликация и индексирование данных из различных источников (в основном Apache Hive) в распределенный облачный кластер.
- Обеспечение обработки запросов в режиме реального времени через REST или брокеры сообщений (Kafka или IBM MQ).
Условия: удаленная работа, фулл тайм. Локация: РФ, РБ.
Стек/инструменты: JIRA, Confluence, корпоративные мессенджеры, Outlook, Scrum.