Duties

Администрирование кластеров Kubernetes;

Администрирование ресурсов в облачных провайдерах (Yandex Cloud);

Планирование и развитие информационных систем;

Участие в процессе CodeReview инфраструктурных приложений и IaC;

Развитие процессов IaC;

Автоматизация и внедрение практик GitOps/DevOps в Инфраструктуре;

Контроль актуальности технической документации;

Администрирование сред виртуализации и обеспечение непрерывности их работы: KVM;

Администрирование Redis, ElasticSearch, RabbitMQ, Kafka.

Requirements

Опыт развертывания, администрирования и траблшутинга высоконагруженных систем оркестрации контейнеров, как on-prem, так и в публичных облаках (у нас Kubernetes);

Понимание подхода IaC и умение его применять. Опыт работы с системами управления конфигурациями (у нас Ansible и Terraform);

Опыт построения систем мониторинга, как системных, так и прикладных решений. Понимание, какие метрики собирать, куда смотреть при проблемах, какие дашборды для этого нужны (мы используем Prometheus/Grafana);

Понимание принципов и опыт построения отказоустойчивых сервисов и эксплуатации высоконагруженных систем (Web-серверов, СУБД, приложений);

Опыт построения процесса непрерывного резервного копирования инфраструктурных компонентов.