Featured image of post 🔥 Пятничное: Алерт-зомби и эпидемия шума

🔥 Пятничное: Алерт-зомби и эпидемия шума

Видно все - решается ничего. Алертов сыпется столько, что внимание стало дефицитом: смотреть некогда, разбирать некому, ответственности нет. Чаты горят, графики красные и полное спокойствие.

🔥 Пятничное: Алерт-зомби и эпидемия шума

Видно все - решается ничего. Алертов сыпется столько, что внимание стало дефицитом: смотреть некогда, разбирать некому, ответственности нет. Чаты горят, графики красные и полное спокойствие.
Когда все важно - не важно ничего. За ночь прилетает сотня срабатываний. Информационные сигналы топят боевые - тот самый on-call, ради которого вообще существует алертинг.

📉 Эволюция мониторинга

Первый месяц: бежим разбираться с каждым уведомлением.
Третий месяц: смотрим только на “критичные”.
Полгода: реагируем, когда звонят пользователи.
Год: звук уведомлений “временно” выключен.
Полтора года: главный мониторинг - телефон службы поддержки.
Самая надежная метрика - не SLI, а “звонит помощник директора”. Секретарь стал SRE и системой раннего оповещения для репутационных рисков.

🧊 Театр наблюдаемости

  • Сотни “бздынь” без реакций - игнор по умолчанию, а не баг.
  • Чем громче мониторинг, тем тише команда: любое ЧП пролистывается как рутина.
  • Алерты по “железу” без связи с SLO и симптомами игнорируется первым - красиво мигает, пользы ноль.
  • Сигнал без владельца - это ничья ответственность и ничье действие.
  • Стратегия “давайте пока оставим” создаем музей шума. Папка “не критично” - кладбище ответственности.

🤔 Пятничные вопросы

  • Сколько систем шлют одно и то же разными словами?
  • Вы узнаете о проблемах из helpdesk раньше, чем от мониторинга?
  • Есть алерты, которые срабатывают ежедневно полгода?
  • Кто ваш самый надежный источник - Zabbix или секретарь?

🧨 Финал

Если алерт не ведет к действию, он не существует. Это художественная литература в формате push.

Создано при помощи Hugo
Тема Stack, дизайн Jimmy