ЧЕМ ВЫ БУДЕТЕ ЗАНИМАТЬСЯ:

Основной фокус - надежность и наблюдаемость:

  • Обеспечение стабильности, доступности и отказоустойчивости окружений (prod/test/infra);
  • Развитие и поддержка системы observability и alerting на основе современного стека (Victoriametrics, Grafana, Tempo, Elasticsearch, Pyroscope, Sentry) для полного контроля над продуктом;
  • Запуск новых продуктов компании: У нас они появляются довольно часто и мы помогаем разработчикам их запускать, улучшаем процессы и документации, чтобы запуски проходили проще и быстрее;
  • Готовить инфраструктуру и сервисы проекта к highload. Нагрузка: Тысячи\десятки тысяч RPS в сервисах и БД, десятки деплоев ежедневно, постоянно растущий трафик и объем данных.

НАШ ТЕХНОЛОГИЧЕСКИЙ СТЕК:

  • Инфраструктура: Managed Kubernetes, GCP, Yandex Cloud, Selectel.
  • Сети: Cloud, Cilium, Linkerd (Service Mesh).
  • Observability: Victoriametrics, Grafana, Tempo, Elasticsearch, OTLP, Pyr-oscope, Sentry.
  • IaaC & CI/CD: Terraform, Terragrunt, Ansible (минимально), GitLab CI.
  • Сервисы и БД: Node.js, Go (HTTP/gRPC), PostgreSQL (CloudNative-PG), ClickHouse, RabbitMQ, Redis.
  • Автоматизации: Внутренние инструменты на Go.

ЧТО МЫ ХОТИМ ВИДЕТЬ:

  • Имеет опыт работы DevOps в высоконагруженных production-средах от 6 лет;
  • Обладает глубоким пониманием Kubernetes и опыт отладки приложений в нем;
  • Имеет практический опыт построения и использования систем observability (мониторинг, логи, трейсинг);
  • Понимает принципы сетевого взаимодействия, работы протоколов (HTTP/gRPC) и уметь диагностировать проблемы на этом уровне;
  • Понимает жизненный цикл и особенности работы реляционных и нереляционных СУБД (PostgreSQL, ClickHouse);
  • Обязательно умеет работать самостоятельно, генерировать задачи и проактивно решать проблемы. Не ждет готовых ТЗ.