Инновационная iGaming-компания ищет SRE Engineer для построения надёжной, масштабируемой и стабильной инфраструктуры для высоконагруженного продукта.
Обязанности:
- Администрирование и настройка Linux-систем
- Проектирование, развёртывание и поддержка облачной инфраструктуры AWS
- Настройка и администрирование Docker-контейнеров и Kubernetes-кластеров
- Настройка и поддержка систем мониторинга и логирования (Prometheus, Grafana, Loki, Alertmanager)
- Мониторинг систем и сервисов, настройка метрик, алертинга и observability
- Управление инцидентами, участие в on-call дежурствах, проведение post-mortem анализа
- Анализ и оптимизация производительности систем и приложений
- Обеспечение стабильности и отказоустойчивости сервисов к высоким нагрузкам
- Масштабирование инфраструктуры и автоматизация процессов
- Оптимизация сетевой архитектуры (VPC, VPN, балансировщики, маршрутизация, файрволы)
- Повышение безопасности инфраструктуры и сервисов
- Улучшение архитектуры приложений и инфраструктурных решений
- Контроль и соблюдение SLA, SLO и SLI, внедрение практик reliability engineering
Требования:
- Глубокое понимание OSI-модели, TCP/IP, VPN (IPsec, SSL), балансировщиков L4/L7
- Опыт работы с Docker; создание и оптимизация Dockerfile, использование Docker Compose
- Настройка и эксплуатация Kubernetes (Helm-чарты, StatefulSets, DaemonSets, Ingress-контроллеры)
- Опыт развёртывания Prometheus + Alertmanager + Grafana; настройка сбора метрик и алертинга; знакомство с Loki
- Опыт настройки CI/CD и реализации пайплайнов в GitLab CI или аналогах
- Автоматизация задач с помощью Ansible, Terraform, Helm
- Опыт написания скриптов на Bash/Python
- Уверенное владение Linux на уровне опытного администратора
- Понимание контейнерных сетей
Условия:
- Удалённая работа с гибким началом дня
- Конкурентоспособное вознаграждение, соответствующее опыту и навыкам
- Работа с топовым iGaming-проектом
- Возможности роста и развития
- Оплачиваемый отпуск и больничные + day off