Timeweb Cloud — провайдер облачных решений с географически распределённой инфраструктурой. Мы разрабатываем IaaS/PaaS-платформу, включающую Managed Kubernetes, DBaaS, S3, LBaaS и виртуальные приватные сети.

Фокус роли: инфраструктура облака: виртуализация, сеть (overlay/underlay), производительность, инциденты уровня платформы.

Обязанности:

  • Расследование сложных инцидентов: анализ логов, трейсов и метрик для поиска корневых причин.
  • Диагностика проблем на уровне Python‑сервисов и скриптов (чтение кода, не активная разработка).
  • Работа с ядром Linux и сетевым стеком для поиска узких мест.
  • Проектирование и установка нетиповых конфигураций, развёртывание распределённых систем в проде на живой нагрузке.
  • Оптимизация производительности хостов виртуализации и сетевых dataplane‑компонентов (NUMA, IRQ/RPS, I/O, планировщики).
  • Автоматизация установки ПО и конфигурации серверов (Bash, Python), работа с SaltStack/Ansible.
  • Настройка и развитие мониторинга (Zabbix и другие системы).
  • Участие в дежурствах (примерно неделя в месяц, oncall) и подключение к аварийным ситуациям высокого уровня.

Требования:

  • Глубокое понимание работы Linux: cgroups, namespaces, сетевой стек, systemd, процессы и система инициализации.
  • Понимание топологии процессоров (NUMA) и учёт при настройке производительности.
  • Умение расследовать проблемы на уровне ядра и системных вызовов (анализ логов, strace и пр.).
  • Понимание дискового I/O, файловых систем, volume‑менеджеров и планировщиков.
  • Опыт с QEMU/KVM и libvirt; понимание различий между VM и контейнерами.
  • Знание VLAN, VXLAN, BGP; опыт с OpenvSwitch и OpenFlow.
  • Опыт с SaltStack и/или Ansible; настройка мониторинга (Zabbix или аналоги).
  • Python на уровне чтения кода и уверенное владение Bash.

Будет плюсом:

  • Базовое понимание Ceph, опыт работы с SAN/NAS.
  • Опыт с SDN и платформами OpenStack / OpenNebula / oVirt; знакомство с OVN, Tungsten Fabric.

Стек: Linux (ядро, systemd), QEMU/KVM, libvirt, VLAN, VXLAN, BGP, OpenvSwitch, OpenFlow, FRR, SaltStack, Ansible, Bash, Python, Zabbix, Prometheus/Node Exporter, Victoria Metrics, Ceph, GitLab CI/CD.

Условия:

  • Официальное оформление в аккредитованной IT‑компании.
  • ДМС, компенсация спорта, компенсация психологических консультаций.
  • 8 дополнительных day‑off в год.
  • Удалённый формат работы или офис у м. Московские ворота (Санкт‑Петербург) с возможностью гибрида.
  • Офисные бонусы: приём офисного врача, компенсация питания, библиотека, кухня с кофе/чаем/фруктами и снеками.