RWB (Объединённая компания Wildberries и Russ) — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT‑компании Wildberries и оператора наружной рекламы Russ.1

Направление работы

Команда SRE отвечает за надежность, отказоустойчивость, производительность и масштабируемость информационных систем. Основной фокус роли — обеспечение стабильной работы инфраструктуры, развитие автоматизации, управление инцидентами и повышение качества взаимодействия между командами разработки и эксплуатации.

Вам предстоит:

— Обеспечивать высокую доступность, отказоустойчивость и надежность информационных систем;
— Разрабатывать и внедрять архитектурные решения, снижающие вероятность системных сбоев;
— Внедрять и развивать практики SLO, SLI, Error Budgets, Post-mortem и управления инцидентами;
— Автоматизировать рутинные и типовые операции с использованием инфраструктурных инструментов;
— Планировать загрузку инженеров, графики дежурств, ставить задачи и контролировать их выполнение;
— Координировать взаимодействие команд разработки, эксплуатации, DevOps, DBA, сетей, мониторинга и безопасности.

Формат работы: Оформление по ТК РБ и условиях работы: удалённая или в офисе на территории Беларуси.

Вы нам подходите, если:

— Имеете опыт управления SRE-командой или инфраструктурной командой;
— Обладаете экспертными знаниями Kubernetes, VmWare, KVM;
— Владеете Go или Python для разработки инструментов автоматизации и внутренних сервисов;
— Используете Bash, Git, Argo CD, Terraform, Ansible в работе с инфраструктурой;
— Понимаете TCP/IP, DNS, HTTP/S, балансировку нагрузки L4/L7;
— Умеете принимать технические решения на основе данных, управлять рисками и объяснять сложные инфраструктурные вопросы техническим и бизнес-командам.

Будет преимуществом:

— Понимаете принципы работы Service Mesh, в том числе Istio;
— Имеете опыт оптимизации ресурсов инфраструктуры;
— Работали с Redis или DragonflyDB.