Международная digital-команда, развивающая собственные технологические продукты и инфраструктуру для high-load систем и работы с глобальным трафиком. Сейчас мы усиливаем техническую команду и ищем DevOps Engineer, который поможет масштабировать инфраструктуру и обеспечивать стабильную работу платформы под высокий трафик.

Чем предстоит заниматься
  • Проектировать и развивать отказоустойчивую инфраструктуру в Kubernetes (GKE) под высокий RPS
  • Масштабировать систему (автоскейлинг, балансировка, оптимизация ресурсов)
  • Управлять микросервисной архитектурой и сетевыми взаимодействиями
  • Настраивать и оптимизировать CDN (Cloudflare / CloudFront) для глобальной доставки PWA
  • Строить полноценную observability систему (Prometheus, Grafana, логирование, трейсинг, алерты через SLO/SLI)
  • Обеспечивать безопасность инфраструктуры (IAM, secrets management, DDoS protection, аудит)
  • Работать с распределёнными БД (CockroachDB / PostgreSQL): репликация, шардирование, бэкапы, миграции
  • Развивать и поддерживать CI/CD пайплайны (GitHub Actions / GitLab CI, канареечные деплои, rollback)
  • Автоматизировать инфраструктуру через Terraform / Ansible
  • Использовать Temporal для оркестрации распределённых воркфлоу
  • Участвовать в архитектурных решениях и технической стратегии
  • Наставлять младших инженеров и делиться экспертизой
Технологический стек
  • Linux (Ubuntu), Bash
  • Docker, Kubernetes (production уровень, GKE)
  • Nginx, CDN (Cloudflare / AWS CloudFront)
  • CockroachDB / PostgreSQL
  • Prometheus, Grafana, Loki / Tempo
  • Terraform, Ansible
  • GitHub Actions / GitLab CI
  • Temporal (обязательно)
  • Google Cloud Platform (GKE, VPC, IAM, Cloud Storage)
  • (опционально) AWS / Azure
Требования
  • 5+ лет коммерческого опыта, из них 3+ года в роли DevOps / SRE
  • Опыт работы с high-load системами (тысячи RPS, миллионы пользователей)
  • Глубокая экспертиза в Docker и Kubernetes (production-кластеры, Helm, сетевые политики, security)
  • Продвинутое понимание сетей (TCP/IP, DNS, HTTP/2, gRPC, балансировка)
  • Практический опыт работы с GCP (GKE, IAM, VPC)
  • Опыт построения CI/CD и инфраструктуры как кода
  • Опыт работы с Temporal или аналогичными системами оркестрации
  • Опыт администрирования БД (репликация, шардирование, отказоустойчивость)
  • Опыт построения мониторинга и observability систем
Будет плюсом
  • Опыт с CockroachDB в распределённых кластерах
  • Опыт внедрения Service Mesh (Istio / Linkerd)
  • Понимание GitOps (ArgoCD / Flux)
  • Опыт разработки на Go / Python
  • Сертификации (CKA / CKAD / GCP DevOps)
Мы ожидаем от кандидата
  • Системное мышление и способность проектировать архитектуру под рост нагрузки
  • Умение работать с компромиссами (stateful vs stateless, consistency vs availability)
  • Проактивность и ownership за инфраструктуру
  • Опыт решения критических инцидентов (DDoS, падения, деградации)
  • Умение чётко и понятно объяснять технические решения
Будет плюсом:
  • Работал с глобальными GEO (EU / LATAM / US / Asia)
  • Масштабировал системы с сотен до тысяч RPS
  • Снижал время восстановления (MTTR) и повышал стабильность системы
  • Имеешь реальные кейсы оптимизации инфраструктуры с цифрами
Условия
  • Конкурентная заработная плата (обсуждается индивидуально)
  • Испытательный срок: 3 месяца
  • Возможность влиять на архитектуру и технические решения
  • Работа с high-load продуктом и сложной инфраструктурой