🔥 Пятничное: Алерт-зомби и эпидемия шума
Видно все - решается ничего. Алертов сыпется столько, что внимание стало дефицитом: смотреть некогда, разбирать некому, ответственности нет. Чаты горят, графики красные и полное спокойствие.
Когда все важно - не важно ничего. За ночь прилетает сотня срабатываний. Информационные сигналы топят боевые - тот самый on-call, ради которого вообще существует алертинг.
📉 Эволюция мониторинга
Первый месяц: бежим разбираться с каждым уведомлением.
Третий месяц: смотрим только на “критичные”.
Полгода: реагируем, когда звонят пользователи.
Год: звук уведомлений “временно” выключен.
Полтора года: главный мониторинг - телефон службы поддержки.
Самая надежная метрика - не SLI, а “звонит помощник директора”. Секретарь стал SRE и системой раннего оповещения для репутационных рисков.
🧊 Театр наблюдаемости
- Сотни “бздынь” без реакций - игнор по умолчанию, а не баг.
- Чем громче мониторинг, тем тише команда: любое ЧП пролистывается как рутина.
- Алерты по “железу” без связи с SLO и симптомами игнорируется первым - красиво мигает, пользы ноль.
- Сигнал без владельца - это ничья ответственность и ничье действие.
- Стратегия “давайте пока оставим” создаем музей шума. Папка “не критично” - кладбище ответственности.
🤔 Пятничные вопросы
- Сколько систем шлют одно и то же разными словами?
- Вы узнаете о проблемах из helpdesk раньше, чем от мониторинга?
- Есть алерты, которые срабатывают ежедневно полгода?
- Кто ваш самый надежный источник - Zabbix или секретарь?
🧨 Финал
Если алерт не ведет к действию, он не существует. Это художественная литература в формате push.
