Обязанности:
Повышение надёжности продуктовВы будете работать над поддержанием высокого качества продуктов: улучшать observability, проводить SLO-ревью, выстраивать систему управления инцидентами — от координации решения проблем в продакшене до анализа метрик работы команд после инцидентов (постмортема). Также вам предстоит участвовать в устранении неполадок на высоконагруженном продакшене. Оптимизация инфраструктуры
Вам предстоит разрабатывать инструменты для эффективной утилизации ресурсов продукта, искать и устранять узкие места, заказывать серверные мощности в облаке, строить безопасную инфраструктуру и участвовать во внедрении практик безопасной разработки ПО. Автоматизация доставки
Вы будете повышать качество и скорость CD артефактов в релизах, новых сервисах и unstable-окружениях для сервисов на пул-реквест. Также вам предстоит участвовать в организации CD-инфраструктуры в IaC, писать скрипты и автоматизировать процессы.
Больше о разработке в Яндексе — в канале Yandex for Developers
Ключевые навыки:
- Работали с системами управления конфигурациями и оркестраторами (Y.Deploy, K8s, Terraform, хостовые конфигурации, Infractl)
- Занимались командной разработкой на Python/Go, работали с ООП, писали тесты
- Выстраивали CI/CD — от написания кода до деплоя в продакшен
- Работали с UNIX‑системами и консолью
- Понимаете принципы работы современных распределённых веб‑приложений
- Готовы и хотите активно развиваться, изучать новые технологии и инструменты
Дополнительные требования:
- Работали в Cloud Engineering: занимались организацией инфраструктуры, её эксплуатацией и траблшутингом
- Проектировали и эксплуатировали распределённые системы 24/7/365
- Занимались оптимизацией и траблшутингом СУБД (PostgreSQL, MongoDB)
- Диагностировали процессы: интерпретация вывода ps, top, strace, perf, tcpdump
- Знаете сетевые протоколы и основы маршрутизации
- Понимаете, как пользовательские приложения взаимодействуют с операционной системой
- Знаете принципы работы генеративного ИИ и NLP
