Обязанности:
Проектирование и оптимизация архитектурыВы будете выстраивать и оптимизировать архитектуру сервисов, обеспечивая их масштабируемость и отказоустойчивость. Автоматизация инфраструктуры
В числе ваших задач — автоматизировать развёртывание, конфигурирование и обслуживание инфраструктуры, поддерживать практики IaC с использованием Terraform. Мониторинг, логирование и реагирование на инциденты
Потребуется настраивать системы мониторинга, чтобы отслеживать ключевые метрики доступности и производительности сервисов. Вы будете оперативно диагностировать и устранять инциденты, минимизируя время простоя сервисов, а также отслеживать показатели SLA/SLI/SLO. Внедрение и поддержка CI/CD и GitOps
Нужно налаживать и поддерживать процессы CI/CD. Ваша цель — обеспечить воспроизводимость сборок и стабильность процессов развёртывания, а также автоматизировать тестирование и проверку безопасности перед выпуском новых версий. Работа с инфраструктурой и облачными сервисами
В ваши обязанности входит администрирование баз данных, очередей и другой инфраструктуры. Вы будете управлять облачными ресурсами: создавать виртуальные машины, настраивать сети и балансировщики нагрузки, обеспечивать высокую доступность сервисов. Также вы станете следить за безопасностью инфраструктуры: управлять доступом, настраивать сетевые политики и своевременно обновлять компоненты. Больше о разработке в Яндексе — в канале Yandex for Developers
Ключевые навыки:
- Глубоко знаете Linux, умеете работать в командной строке, знаете Bash
- Работали на практике с контейнеризацией и оркестрацией (Docker, Kubernetes), отлично разбираетесь в них
- Автоматизировали инфраструктуру через IaC, знаете Terraform
- Настраивали и поддерживали системы мониторинга для Kubernetes (например, Prometheus или VictoriaMetrics, Grafana, Alertmanager)
- Умеете организовать сбор и анализ логов (Vector, Fluent Bit, Loki, стек ELK)
- Работали с CI/CD-платформами (например, GitLab CI, GitHub Actions, Azure DevOps и т. п.)
- Администрировали PostgreSQL
- Умеете разрабатывать инструменты автоматизации на Python
- Работали хотя бы с одним крупным облачным провайдером (Yandex Cloud, AWS, Azure, Google)
Дополнительные требования:
- Работали с GitOps-инструментами (ArgoCD, Flux CD)
- Знакомы с Kafka
- Имели дело с ClickHouse