Проект: банк. Репликация данных из источников в распределенный облачный кластер и индексирование данных для обработки запросов в режиме реального времени.

Требования:

  • Базовый уровень знания Java (циклы, условия, хешмапы и т.д.).
  • Базовый уровень знания и понимание CI/CD.
  • Linux (basic), Ansible, SQL, Git, XML, JSON, XSLT, YAML.
  • Базовые знания экосистемы Hadoop и его компонентов: Apache Solr, Apache Hive, Apache HBase, Apache Spark, Apache Zookeeper, Apache Oozie, Apache Camel.
  • Английский: технический (чтение документации).

Задачи:

  • Репликация и индексирование данных из различных источников (в основном Apache Hive) в распределенный облачный кластер.
  • Обеспечение обработки запросов в режиме реального времени через REST или брокеры сообщений (Kafka или IBM MQ).

Условия: удаленная работа, фулл тайм. Локация: РФ, РБ.

Стек/инструменты: JIRA, Confluence, корпоративные мессенджеры, Outlook, Scrum.