Яндекс Афиша — ведущий онлайн-сервис по продаже билетов в России. Мы также развиваем и зарубежное направление. Предлагаем широкий выбор мероприятий: концерты, театральные представления, спортивные события и многое другое. Предоставляем полный комплекс услуг для партнёров и удобный сервис для пользователей, в том числе покупку, возврат билетов и обмен впечатлениями. Мы ищем SRE‑инженера или разработчика инфраструктуры с опытом в эксплуатации. Стек эксплуатации: * Приложения — Java, Kotlin, Node.js, Go * Хранилища — MongoDB, PostgreSQL, Redis, YT * Инструменты — Python, Go, Trivy, Infractl, ArcadiaCI, YQL, Yandex Monitoring, Kubernetes, DataLens * Паттерны и практики — IaC, ArchOps, SLO, ServiceMesh, L3 + L7, ZBP

Обязанности:

Повышение надёжности продуктов
Вы будете работать над поддержанием высокого качества продуктов: улучшать observability, проводить SLO-ревью, выстраивать систему управления инцидентами — от координации решения проблем в продакшене до анализа метрик работы команд после инцидентов (постмортема). Также вам предстоит участвовать в устранении неполадок на высоконагруженном продакшене. Оптимизация инфраструктуры
Вам предстоит разрабатывать инструменты для эффективной утилизации ресурсов продукта, искать и устранять узкие места, заказывать серверные мощности в облаке, строить безопасную инфраструктуру и участвовать во внедрении практик безопасной разработки ПО. Автоматизация доставки
Вы будете повышать качество и скорость CD артефактов в релизах, новых сервисах и unstable-окружениях для сервисов на пул-реквест. Также вам предстоит участвовать в организации CD-инфраструктуры в IaC, писать скрипты и автоматизировать процессы.
Больше о разработке в Яндексе — в канале Yandex for Developers

Ключевые навыки:

Работали с системами управления конфигурациями и оркестраторами (Y.Deploy, K8s, Terraform, хостовые конфигурации, Infractl)
Занимались командной разработкой на Python/Go, работали с ООП, писали тесты
Выстраивали CI/CD — от написания кода до деплоя в продакшен
Работали с UNIX‑системами и консолью
Понимаете принципы работы современных распределённых веб‑приложений
Готовы и хотите активно развиваться, изучать новые технологии и инструменты

Дополнительные требования:

Работали в Cloud Engineering: занимались организацией инфраструктуры, её эксплуатацией и траблшутингом
Проектировали и эксплуатировали распределённые системы 24/7/365
Занимались оптимизацией и траблшутингом СУБД (PostgreSQL, MongoDB)
Диагностировали процессы: интерпретация вывода ps, top, strace, perf, tcpdump
Знаете сетевые протоколы и основы маршрутизации
Понимаете, как пользовательские приложения взаимодействуют с операционной системой
Знаете принципы работы генеративного ИИ и NLP

SRE-инженер в Яндекс Афишу

Описание вакансии