Ищем Site Reliability Engineer (SRE) в международную логистическую компанию GBS.
Проект: Поддержка и развитие legacy-инфраструктуры на базе Rancher 1.6.
Вы будете заниматься поддержкой, эволюцией и наблюдаемостью legacy-инфраструктуры на Rancher 1.6, IPsec mesh и HAProxy.
Мы ищем человека, который пишет инструменты сам, глубоко понимает сети и готов разбираться в low-level проблемах (DNS, перезагрузка балансировщиков, туннели).
Задачи:
- Поддержка и развитие инфраструктуры на Rancher 1.6 (контейнеризация, управление окружениями).
- Работа с IPsec mesh и overlay-сетями — диагностика, оптимизация, отказоустойчивость.
- Настройка и тюнинг HAProxy (L4/L7) в связке с контейнерной средой.
- Разработка инструментов автоматизации и наблюдаемости на Python.
- Построение мониторинга на Prometheus: кастомные метрики, алерты, сбор данных с legacy-компонентов.
- Troubleshooting production-инцидентов без готовых алертов.
- Работа с сопутствующими сервисами: PostgreSQL, RabbitMQ.
- Написание документации и runbook’ов для типовых проблем.
Требования (обязательно):
- Опыт в DevOps / SRE от 4 лет.
- Docker на практике — уверенная работа с контейнерами.
- HAProxy или аналогичные L7/L4 балансировщики (настройка, релоады, debugging).
- Prometheus — не только базовые метрики, но и написание кастомных экспортеров/метрик.
- Глубокое понимание сетей: TCP/IP, VPN (особенно IPsec), overlay, маршрутизация.
- Опыт реального troubleshooting production-инцидентов.
- Умение писать код на Python для автоматизации, мониторинга, вспомогательных инструментов.
- Опыт работы с нестандартной / legacy инфраструктурой.
- Готовность разбираться в low-level проблемах (сеть, DNS, механика перезагрузки HAProxy, Rancher 1.6).
Желательно / будет плюсом:
- Опыт с Rancher 1.x.
- PostgreSQL и RabbitMQ (диагностика, мониторинг).
- Опыт построения mesh / cluster-мониторинга.
Мы предлагаем:
- Реальные задачи с высокой инженерной сложностью.
- Минимум бюрократии — максимум самостоятельности.
- Возможность влиять на архитектуру наблюдаемости и надёжности.
- Заработную плату в зависимости от уровня от 250 000 до 400 000 руб. гросс.
Стек: Rancher, HAProxy, Prometheus, IPsec, Python, Docker.
