О компании
B2B SaaS-платформа для Северной Америки. 8 лет на рынке, ~150 человек, ~100 в R&D. Полностью remote (~50 в США, ~100 в Европе), офисы в Канаде/США/на Кипре для желающих.

Стек
AWS (EKS, RDS, ALB, S3, CloudWatch, Route53), Terraform, Kubernetes (12 EKS-кластеров), Helm, Docker/ECR, PostgreSQL, ClickHouse, Prometheus/Grafana, Vault, CircleCI, Python для автоматизации.

Что делать

  • Управление и развитие Kubernetes-инфраструктуры: 12 EKS-кластеров, ~150 тенантов
  • Terraform — IaC для всей инфраструктуры: VPC, EKS, RDS, IAM, ALB, политики
  • Мониторинг и incident response: Prometheus, Grafana, CloudWatch, Sentry. Расследование инцидентов, постмортемы
  • Работа с базами данных на уровне инфраструктуры: PostgreSQL RDS (репликация, Performance Insights, WAL, backup), ClickHouse
  • CI/CD: пайплайны деплоя, Helm charts
  • Безопасность: аудит, ротация секретов, network policies, IAM
  • Автоматизация рутины: скрипты, CronJobs, автоматизация мониторинга с AI-тулингом

Про команду
Команда DevOps — 3 человека. Работаем близко с разработкой, видим всё от кода до железа. Нет разделения на “я только terraform” или “я только мониторинг” — каждый занимается всем. Прямая коммуникация с PM и engineering, без прослоек.

Кого ищем

  • Senior, 5+ лет в DevOps/SRE/Platform Engineering
  • AWS: EKS, RDS, IAM, VPC, ALB — на уровне "могу спроектировать и поднять с нуля"
  • Kubernetes в production: деплой, troubleshooting, node management, RBAC, ingress, HPA
  • Terraform: модули, state management, multi-environment
  • Мониторинг: Prometheus + Grafana, PromQL, дашборды и алерты
  • Linux, networking, troubleshooting: уверенная диагностика на уровне ОС и сети
  • Самостоятельность: работа без микроменеджмента, умение приоритизировать
  • Русский — основной рабочий, английский — рабочий уровень (документация, коммуникация с US-командой)

Будет плюсом

  • PostgreSQL на уровне DBA: репликация, тюнинг
  • ClickHouse: администрирование, Keeper, репликация
  • Python для автоматизации (скрипты, тулинг)
  • Опыт автоматизации с LLM/AI-агентами

Условия

  • Полностью удалённая работа
  • Сеньорская команда, плоская структура, нет микроменеджмента
  • Безлимитные отпуска, нет фиксированных часов, SLA на Slack — 24h
  • Оффсайты 2x/год (Кипр + Грузия/Армения)
  • Бюджет на обучение, конференции, технику
  • Очень низкая текучка — многие работают по 5–6 лет
  • Коммуникация внутри команды на русском