Проект: Ритейл.

Локация: РФ. Формат: удаленно. Занятость: фуллтайм.

Обязанности:

  • Развертывание и настройка экспортеров (node_exporter, postgres_exporter, blackbox_exporter, cAdvisor, kube-state-metrics)
  • Написание сложных PromQL-запросов (histogram_quantile, predict_linear, rate)
  • Создание параметризованных дашбордов в Grafana с переменными и аннотациями алертов
  • Разработка кастомных HTTP-экспортеров на Go для сбора метрик из очередей сообщений (Kafka/RabbitMQ), планировщиков задач, SCADA/Modbus/OPC UA и SNMP-устройств с использованием библиотеки prometheus/client_golang
  • Настройка Alertmanager: маршрутизация алертов, inhibition и silences для плановых работ, интеграция с BMC Remedy и мессенджером (webhook)
  • Мониторинг Kubernetes (ноды, поды, контейнеры) через kube-state-metrics и cAdvisor; настройка алертов на состояния CrashLoopBackOff, OOMKilled, NotReady
  • Написание unit-тестов для правил алертинга (promtool test rules) и создание скриптов-имитаций метрик (Python/Go) для валидации порогов и эскалации
  • Конфигурирование таймеров (for), группировки и повторных уведомлений в Alertmanager

Требования: релевантный опыт