清除无效告警常用方法
1、告警的本质
没有多少系统的告警是设计得当的。良好的告警设计是一项非常困难的工作。如何知道你收到的告警是糟糕的?多少次你收到了告警之后,立即就关掉了的?

2、告警对象可以分为两种:
业务规则监控
系统可靠性监控

3、高质量的告警是actionable的,不应该用采集的难度决定你使用什么指标去告警

4、1:不要别人做什么告警,你就做什么,要做“真正”有用的告警:特别是cpu使用率告警
is work getting done:请求数 + 成功率

5、2:is the user having good experience:响应延迟
只要采集对了指标,大部分时候告警不需要复杂算法

6、3:基于算法的异常检测:算法不难,实在必要也是可以做到的

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
阅读量:109
阅读量:90
阅读量:44
阅读量:123
阅读量:89