睿象云:为什么 Zabbix 告警如此火热?
阅读原文时间:2023年07月08日阅读:3

每当我们谈及监控工具的时候,Zabbix 总是最惹人瞩目的那一个。如同清晨荷叶上的剔透露珠,卓尔不凡;如同巷子末头的百年酒香,让人倾心。我们都知道 Zabbix 是监控工具里当仁不让的龙头大哥,却没几人能清楚掰扯出背后的走马历史,今天,小编略献拙笔,给大家浅析一下 Zabbix 大热下的因果缘由。

作为一项“舶来品”,Zabbix 初来中国之时,便受到了美团、小米、360 等互联网公司的热爱,包括文青聚集地-豆瓣,以经营业务广泛著称的58同城,和活跃于影视行业里的 PPTV 。这些互联网公司无不钟情于使用 Zabbix 来监控告警,因为他们喜欢 Zabbix 的简易, Zabbix 的稳定,和 Zabbix 的完善功能所带来的可靠护航能力。

企业体大,唯有千万不疏方能固若金汤。

在江湖对 Zabbix 的倾心追捧下,是其出厂自带的强大特点,极具优势,引领风华;是其谆谆善诱的学习规则,亦步亦趋,层层高进。

1.数据收集

  • 可用性、性能检测。

  • 支持Agent 、 SNMP  (包括 Trapping 和 Polling ) 、IPMI 、JMX 、 SSH 、Telnet 等。

  • 自定义检测。

  • 自定义收集数据的频率。

  • 客户端/代理端/服务器端模式。

2.灵活的触发器

  • 可以定义非常灵活的告警阈值和与多种告警相关联的条件。

3. 高度可定制的告警

  • 发送通知,可定制包括告警级别、动作升级、收件人和媒体类型。

  • 通知可以使用全局宏变量和自定义变量。

  • 自动处理功能包括远程命令的自动调用和执行。

4.实时的绘图功能

  • 监控项将数据实时绘制在图形上。

5. Web 监控能力

  • Zabbix 可以模拟浏览器请求访问一个网站,并检查返回值和响应时间。

6.多种可视化展示

  • 可以自定义监控的展示图,将多种监控数据集中展示到一张图上。

  • 网络拓扑图。

  • 自定义的 Screens 和 Slide shows 可以将多种图形集中展示。

  • 报表功能。

  • 资源使用情况的监控展示。

7.历史数据的存储

  • 将数据存储在数据库中。

  • 历史数据的存放周期可配置。

  • 定期删除过期的历史数据。

8.配置非常容易

  • 配置比较简单,只需要以下两步即可。

(1)添加设备。

(2)应用模板即可完成监控。

9.使用模板

  • 模板可以分组。

  • 模板具有可继承性。

10.网络发现

  • 支持自动发现网络设备和服务器(可以通过配置自动发现服务规则实现)。

  • Agent 自动注册。

  • 支持用自动发现( Low Level Discovery )实现动态监控项的批量监控(支持自定义),内置的自动发现包括文件系统、网络接口、 SNMP OID ,可定制自动发现。

11.快速的访问接口

  • Web 页面基于 PHP 。

  • 远程访问。

  • 日志审计。

12. API 功能

  • 应用 API 功能可以方便地与其他系统结合,包括手机客户端的使用。

13.系统权限

  • 不同的用户展示监控的资源不同

  • 用户身份认证

14.程序特性

  • 服务器端 Zabbix-Server 和采集端 Zabbix-Agcnt 使用C语言编写,其性能非常高,内存开销非常小。

15.大型环境的支持

  • 利用 Zabbix-Proxy 方式可轻松构建远程监控。

Zabbix 使用起来非常简单,使用者稍加学习即可上手,即使小白也可快速掌握。

这里暂且把对 Zabbix 的掌握程度分成3个阶段。

入门阶段:以前从未接触过任何监控系统,也不熟悉Linux 操作系统。在这个阶段,能够熟练地掌握 Zabbix 的安装和基本配置即可。

中级阶段:具备Linux 基础,熟悉 LAMP 和 LNMP 环境搭建、MySQL 数据库、Shell 脚本,以及具有简单的英文阅读能力,主要难点在于触发器、数据库调优和 API 的使用。在这个阶段,使用者可以将 Zabbix 与其他系统进行集成对接。

高级阶段:熟悉 PHP 语言或 C 语言,具备二次开发能力,能够修改源码,可以对 Zabbix 从代码级别进行优化和扩展。在这个阶段,使用者一般都能熟练地掌握 Zabbix 的各个功能,已经从使用阶段到了源码级别的研究阶段,因此主要是对编程能力的要求。

随着不断的学习和研究,我们的知识水平也会水涨船高,逐节提升。因为在使用Zabbix 的过程中,也会学习其背后的知识和原理,这时候就不止是掌握 Zabbix 了,而是要掌握一套监控体系的知识,因此,通过不断的积累和沉淀,我们就具备了举一反三、 触类旁通的能力。所以,学习 Zabbix 的过程,(对于工作上的帮助)将会让我们终身受益。

然而,即使 Zabbix 可以自定义非常灵活的告警阈值和与多种告警相关联的条件,但是混合型多工具的告警接入与告警流程的智能管理却是 Zabbix 的短板,致使单一的监控并不能实现有效的告警管理。

在信息化,大数据的今日,运维工作越加繁琐,倘若不能有效地管理告警,单一的监控工作再优秀也于事无补。

因此,依托一个强大的告警管理平台,可以让拥有精准监控工具的运维工作更上一层楼,帮助运维人员统一管理海量告警信息,精准维护系统安全环境!

智能告警平台 Cloud Alert (以下简称 CA 平台)秉承着轻松接入,智能管理的原则,提供跨多家公有云的告警实时接入,同时支持 Zabbix 、Nagios 、Cacti 、Solarwinds 、Prometheus 等主流监控工具对接,实现对不同厂商,不同工具接入的告警集中管理,快速定位问题根源。

对于运维人员头疼不已的告警风暴问题,CA 平台会自动基于时间序列,将相同的事件/告警压缩,达到自动去重的目的,然后将相似、同源告警再次进行规则压缩,再通过我们海量的算法积累进行智能降噪,使得最终呈现的报警有序而简洁,避免多重警报,一眼洞察难疑。

CA 平台更在传统告警通知方式上开发了分派策略与通知策略,进一步方便了运维人员的使用和监测,感兴趣的朋友可以查看往期文章:《 Zabbix + Cloud Alert 实践分享》,了解更多信息。

您也可以点击“立即注册”成为 CA 平台用户,体验智能告警平台 Cloud Alert 给您带来的全新震撼!