Ключевые задачи:
-
Поддержание стабильности систем и сервисов компании.
-
Внедрение и настройка мониторинга, алертинга и инструментов анализа производительности.
-
Автоматизация рутинных процессов и задач эксплуатации.
-
Сопровождение и оптимизация контейнерной инфраструктуры.
-
Обеспечение высокой доступности и отказоустойчивости сервисов.
-
Участие в расследовании и анализе инцидентов, внедрение мер для предотвращения их повторения.
-
Оптимизация использования ресурсов и повышение операционной эффективности.
-
Взаимодействие с командами разработки, тестирования и DevOps для построения стабильной и масштабируемой архитектуры.
От тебя мы ждем:
-
Уверенные знания Linux, сетевых принципов и протоколов.
-
Опыт работы с Kubernetes и Docker.
-
Практический опыт настройки и сопровождения CI/CD процессов.
-
Знание систем мониторинга и алертинга (Prometheus, Grafana).
-
Владение одним из языков программирования на уровне Middle (например, Python, Go, Bash и др.).
-
Опыт troubleshooting и автоматизации эксплуатационных процессов.