О компании
B2B SaaS-платформа для Северной Америки. 8 лет на рынке, ~150 человек, ~100 в R&D. Полностью remote (~50 в США, ~100 в Европе), офисы в Канаде/США/на Кипре для желающих.
Стек
AWS (EKS, RDS, ALB, S3, CloudWatch, Route53), Terraform, Kubernetes (12 EKS-кластеров), Helm, Docker/ECR, PostgreSQL, ClickHouse, Prometheus/Grafana, Vault, CircleCI, Python для автоматизации.
Что делать
- Управление и развитие Kubernetes-инфраструктуры: 12 EKS-кластеров, ~150 тенантов
- Terraform — IaC для всей инфраструктуры: VPC, EKS, RDS, IAM, ALB, политики
- Мониторинг и incident response: Prometheus, Grafana, CloudWatch, Sentry. Расследование инцидентов, постмортемы
- Работа с базами данных на уровне инфраструктуры: PostgreSQL RDS (репликация, Performance Insights, WAL, backup), ClickHouse
- CI/CD: пайплайны деплоя, Helm charts
- Безопасность: аудит, ротация секретов, network policies, IAM
- Автоматизация рутины: скрипты, CronJobs, автоматизация мониторинга с AI-тулингом
Про команду
Команда DevOps — 3 человека. Работаем близко с разработкой, видим всё от кода до железа. Нет разделения на “я только terraform” или “я только мониторинг” — каждый занимается всем. Прямая коммуникация с PM и engineering, без прослоек.
Кого ищем
- Senior, 5+ лет в DevOps/SRE/Platform Engineering
- AWS: EKS, RDS, IAM, VPC, ALB — на уровне "могу спроектировать и поднять с нуля"
- Kubernetes в production: деплой, troubleshooting, node management, RBAC, ingress, HPA
- Terraform: модули, state management, multi-environment
- Мониторинг: Prometheus + Grafana, PromQL, дашборды и алерты
- Linux, networking, troubleshooting: уверенная диагностика на уровне ОС и сети
- Самостоятельность: работа без микроменеджмента, умение приоритизировать
- Русский — основной рабочий, английский — рабочий уровень (документация, коммуникация с US-командой)
Будет плюсом
- PostgreSQL на уровне DBA: репликация, тюнинг
- ClickHouse: администрирование, Keeper, репликация
- Python для автоматизации (скрипты, тулинг)
- Опыт автоматизации с LLM/AI-агентами
Условия
- Полностью удалённая работа
- Сеньорская команда, плоская структура, нет микроменеджмента
- Безлимитные отпуска, нет фиксированных часов, SLA на Slack — 24h
- Оффсайты 2x/год (Кипр + Грузия/Армения)
- Бюджет на обучение, конференции, технику
- Очень низкая текучка — многие работают по 5–6 лет
- Коммуникация внутри команды на русском