Проект: Ритейл.
Локация: РФ. Формат: удаленно. Занятость: фуллтайм.
Обязанности:
- Развертывание и настройка экспортеров (node_exporter, postgres_exporter, blackbox_exporter, cAdvisor, kube-state-metrics)
- Написание сложных PromQL-запросов (histogram_quantile, predict_linear, rate)
- Создание параметризованных дашбордов в Grafana с переменными и аннотациями алертов
- Разработка кастомных HTTP-экспортеров на Go для сбора метрик из очередей сообщений (Kafka/RabbitMQ), планировщиков задач, SCADA/Modbus/OPC UA и SNMP-устройств с использованием библиотеки prometheus/client_golang
- Настройка Alertmanager: маршрутизация алертов, inhibition и silences для плановых работ, интеграция с BMC Remedy и мессенджером (webhook)
- Мониторинг Kubernetes (ноды, поды, контейнеры) через kube-state-metrics и cAdvisor; настройка алертов на состояния CrashLoopBackOff, OOMKilled, NotReady
- Написание unit-тестов для правил алертинга (promtool test rules) и создание скриптов-имитаций метрик (Python/Go) для валидации порогов и эскалации
- Конфигурирование таймеров (for), группировки и повторных уведомлений в Alertmanager
Требования: релевантный опыт