Продуктовая компания — revenue management платформа для мобильных приложений. Платформа используется более 20 000 приложений по всему миру.

Роль "играющего тренера": стратегическое лидерство вместе с hands-on участием. Инфраструктура on-premise. В приоритете достижение 99.99% uptime, разработка стратегии disaster recovery с геораспределением и масштабирование основного хранилища.

Обязанности:

  • Менеджмент распределенной команды.
  • Улучшение метрик надежности (MTBF, MTTR), построение мониторинга на симптомы, а не на сбои.
  • Проектирование и поддержка высоконагруженной инфраструктуры под миллионы пользователей.
  • Обучение инженеров эффективным и надежным практикам delivery.

Требования:

  • 8+ лет релевантного опыта в роли DevOps/SRE (k8s, PostgreSQL, ClickHouse, Kafka).
  • Опыт управления командой обязателен.
  • Опыт создания с нуля или принятия ключевых архитектурных решений в высоконагруженных SaaS-системах.
  • Системное мышление: баланс между краткосрочными целями и долгосрочным видением.
  • Подтвержденный трек-рекорд по разрешению bottleneck'ов и production-инцидентов.
  • Уверенное знание одного или нескольких языков: Python, Golang, C/C++, JavaScript.
  • Желательно: опыт работы с bare metal серверами.

Условия:

  • Формат: фулл-тайм, удаленно (за исключением РФ).
  • Вилка зарплаты указана ниже.