Timeweb Cloud — провайдер облачных решений с географически распределённой инфраструктурой. Мы разрабатываем IaaS/PaaS-платформу, включающую Managed Kubernetes, DBaaS, S3, LBaaS и виртуальные приватные сети.
Фокус роли: инфраструктура облака: виртуализация, сеть (overlay/underlay), производительность, инциденты уровня платформы.
Обязанности:
- Расследование сложных инцидентов: анализ логов, трейсов и метрик для поиска корневых причин.
- Диагностика проблем на уровне Python‑сервисов и скриптов (чтение кода, не активная разработка).
- Работа с ядром Linux и сетевым стеком для поиска узких мест.
- Проектирование и установка нетиповых конфигураций, развёртывание распределённых систем в проде на живой нагрузке.
- Оптимизация производительности хостов виртуализации и сетевых dataplane‑компонентов (NUMA, IRQ/RPS, I/O, планировщики).
- Автоматизация установки ПО и конфигурации серверов (Bash, Python), работа с SaltStack/Ansible.
- Настройка и развитие мониторинга (Zabbix и другие системы).
- Участие в дежурствах (примерно неделя в месяц, oncall) и подключение к аварийным ситуациям высокого уровня.
Требования:
- Глубокое понимание работы Linux: cgroups, namespaces, сетевой стек, systemd, процессы и система инициализации.
- Понимание топологии процессоров (NUMA) и учёт при настройке производительности.
- Умение расследовать проблемы на уровне ядра и системных вызовов (анализ логов, strace и пр.).
- Понимание дискового I/O, файловых систем, volume‑менеджеров и планировщиков.
- Опыт с QEMU/KVM и libvirt; понимание различий между VM и контейнерами.
- Знание VLAN, VXLAN, BGP; опыт с OpenvSwitch и OpenFlow.
- Опыт с SaltStack и/или Ansible; настройка мониторинга (Zabbix или аналоги).
- Python на уровне чтения кода и уверенное владение Bash.
Будет плюсом:
- Базовое понимание Ceph, опыт работы с SAN/NAS.
- Опыт с SDN и платформами OpenStack / OpenNebula / oVirt; знакомство с OVN, Tungsten Fabric.
Стек: Linux (ядро, systemd), QEMU/KVM, libvirt, VLAN, VXLAN, BGP, OpenvSwitch, OpenFlow, FRR, SaltStack, Ansible, Bash, Python, Zabbix, Prometheus/Node Exporter, Victoria Metrics, Ceph, GitLab CI/CD.
Условия:
- Официальное оформление в аккредитованной IT‑компании.
- ДМС, компенсация спорта, компенсация психологических консультаций.
- 8 дополнительных day‑off в год.
- Удалённый формат работы или офис у м. Московские ворота (Санкт‑Петербург) с возможностью гибрида.
- Офисные бонусы: приём офисного врача, компенсация питания, библиотека, кухня с кофе/чаем/фруктами и снеками.