Duties
Администрирование кластеров Kubernetes;
Администрирование ресурсов в облачных провайдерах (Yandex Cloud);
Планирование и развитие информационных систем;
Участие в процессе CodeReview инфраструктурных приложений и IaC;
Развитие процессов IaC;
Автоматизация и внедрение практик GitOps/DevOps в Инфраструктуре;
Контроль актуальности технической документации;
Администрирование сред виртуализации и обеспечение непрерывности их работы: KVM;
Администрирование Redis, ElasticSearch, RabbitMQ, Kafka.
Requirements
Опыт развертывания, администрирования и траблшутинга высоконагруженных систем оркестрации контейнеров, как on-prem, так и в публичных облаках (у нас Kubernetes);
Понимание подхода IaC и умение его применять. Опыт работы с системами управления конфигурациями (у нас Ansible и Terraform);
Опыт построения систем мониторинга, как системных, так и прикладных решений. Понимание, какие метрики собирать, куда смотреть при проблемах, какие дашборды для этого нужны (мы используем Prometheus/Grafana);
Понимание принципов и опыт построения отказоустойчивых сервисов и эксплуатации высоконагруженных систем (Web-серверов, СУБД, приложений);
Опыт построения процесса непрерывного резервного копирования инфраструктурных компонентов.