Почему ваш мониторинг врет? SRE об алертах и наблюдаемости | «В SREду на кухне» | AvitoTech

Аватар автора
AvitoTech
В SREду на кухне — подкаст, в котором инженеры из Авито и приглашенные гости обсуждают, что такое SRE и как его готовить. Выпуск о том, что такое мониторинг и почему он снова красный. Обсуждаем метрики, алерты, alert storm, ложные сигналы и культуру мониторинга. Как SRE читают графики, что важно бизнесу и почему «всё зелёное» — не всегда хорошо. Ведущие: Михаил Савин, SRE Community Lead в Авито Андрей Волхонский, руководитель юнита System в Центре разработки инфраструктуры Авито Евгений Харченко, руководитель отдела по развитию практик в разработке и эксплуатации в Райффайзен Банк 00:00 — Почему мониторинг врёт 01:18 — Что такое мониторинг 02:24 — Мониторинг как процесс 04:18 — Мониторинг и бизнес 06:57 — Мониторинг vs траблшутинг 10:07 — Пользовательские пути и бизнес-метрики 11:45 — Observability, алерты и мониторинг 13:44 — RED, US и золотые сигналы 16:14 — Что мониторить в первую очередь 18:03 — Очереди, Saturn и аномалии 22:23 — «Всё зелёное — значит всё ок?» 23:19 — Почему нет универсальных метрик 25:04 — Ошибка фокуса на техметриках 27:42 — Надёжность глазами пользователя 31:29 — DevOps, SRE и ответственность 32:37 — Как мониторят большие компании 36:21 — Алерты, шум и выгорание 40:02 — Метрики для бизнеса 43:15 — Фолс-позитивы и фолс-негативы 46:03 — Агрегация и дедупликация 47:20 — Как делать дашборды 50:08 — Ограничения восприятия 52:59 — Итоги Больше о технологиях и инженерной культуре в Авито можно узнать здесь: В выпуске упомянуты:

0/0


0/0

0/0

0/0

Скачать популярное видео

Популярное видео

0/0