Ищем Site Reliability Engineer (SRE) в международную логистическую компанию GBS.

Проект: Поддержка и развитие legacy-инфраструктуры на базе Rancher 1.6.

Вы будете заниматься поддержкой, эволюцией и наблюдаемостью legacy-инфраструктуры на Rancher 1.6, IPsec mesh и HAProxy.

Мы ищем человека, который пишет инструменты сам, глубоко понимает сети и готов разбираться в low-level проблемах (DNS, перезагрузка балансировщиков, туннели).

Задачи:

  • Поддержка и развитие инфраструктуры на Rancher 1.6 (контейнеризация, управление окружениями).
  • Работа с IPsec mesh и overlay-сетями — диагностика, оптимизация, отказоустойчивость.
  • Настройка и тюнинг HAProxy (L4/L7) в связке с контейнерной средой.
  • Разработка инструментов автоматизации и наблюдаемости на Python.
  • Построение мониторинга на Prometheus: кастомные метрики, алерты, сбор данных с legacy-компонентов.
  • Troubleshooting production-инцидентов без готовых алертов.
  • Работа с сопутствующими сервисами: PostgreSQL, RabbitMQ.
  • Написание документации и runbook’ов для типовых проблем.

Требования (обязательно):

  • Опыт в DevOps / SRE от 4 лет.
  • Docker на практике — уверенная работа с контейнерами.
  • HAProxy или аналогичные L7/L4 балансировщики (настройка, релоады, debugging).
  • Prometheus — не только базовые метрики, но и написание кастомных экспортеров/метрик.
  • Глубокое понимание сетей: TCP/IP, VPN (особенно IPsec), overlay, маршрутизация.
  • Опыт реального troubleshooting production-инцидентов.
  • Умение писать код на Python для автоматизации, мониторинга, вспомогательных инструментов.
  • Опыт работы с нестандартной / legacy инфраструктурой.
  • Готовность разбираться в low-level проблемах (сеть, DNS, механика перезагрузки HAProxy, Rancher 1.6).

Желательно / будет плюсом:

  • Опыт с Rancher 1.x.
  • PostgreSQL и RabbitMQ (диагностика, мониторинг).
  • Опыт построения mesh / cluster-мониторинга.

Мы предлагаем:

  • Реальные задачи с высокой инженерной сложностью.
  • Минимум бюрократии — максимум самостоятельности.
  • Возможность влиять на архитектуру наблюдаемости и надёжности.
  • Заработную плату в зависимости от уровня от 250 000 до 400 000 руб. гросс.

Стек: Rancher, HAProxy, Prometheus, IPsec, Python, Docker.