阿里云-云小站(无限量代金券发放中)
【腾讯云】云服务器、云数据库、COS、CDN、短信等热卖云产品特惠抢购

服务器监控介绍

175次阅读
没有评论

共计 1284 个字符,预计需要花费 4 分钟才能阅读完成。

一、监控思考

监控只能让维护人员查看到主机的状态么?

答: 实时收集数据,通过报警及时发现问题,及时处理,所获取的数据也可以为系统优化提供依据。

监控四要素

如果我想让你监控一个人 你最想知道的是什么?

1、监控谁 监控什么

2、什么时候监控 你现在就去 全天跟着 还是看十分钟就回来? 也就是说是一次性的还是循环的?

3、有问题如何汇报? 管理员还是其他用户

4、监控方法 明着跟着 还是暗地跟着

监控一个设备也是这样的

  • 监控对象 [主机状态 服务 资源 页面,url]
  • 用什么监控 [zabbix-server zabbix-agent]
  • 什么时间监控 [7×24 5×8]
  • 报警给谁 [管理员]

二、主流的开源监控平台分析

  • mrtg (Multi Router Traffic Grapher)通过 snmp 协议得到设备的流量信息,并以包含 PNG 格式的图形的 HTML 页面方式显示给用户。
  • cacti (仙人掌) 用 php 语言实现的一个软件,它的主要功能是用 snmp 服务获取数据,然后用 rrdtool 储存和更新数据。现在主要在 IDC 机房使用,主要用在监控网卡以及交换机路由器的端口,由于出图慢,默认 5 分钟更新一次(最快可以调成一分钟),而现在很多领域都要求实时的,这个时间就显得有些长,又很难自定义监控,所以很少用它监控除了交换机路由器以外的设备

服务器监控介绍

官网地址: https://www.cacti.net/

  • ntop 官网地址: https://www.ntop.org/
  • nagios 能够跨平台, 插件多(监控的东西多), 可以自定义–灵活,报警功能强大。或者说 nagios 就是一个平台,这个平台依靠插件来工作,想要什么样的插件可以用任意语言 自己写,但是由于机器数量越来越多,并且还要求地域性容灾,所以服务器都存放在不同的机房里面,这个时候 nagios 的不能分布式监控的缺陷就显现出来了。如果想监控这些服务器,就需要在每一个机房都部署一台 nagios,然后分别去登录这些服务器查看。

服务器监控介绍

官网地址: https://www.nagios.org/

  • centreon 底层使用的就是 nagios。是一个 nagios 整合版软件。界面比 nagios 要好看很多。

服务器监控介绍

官网地址: https://www.centreon.com/

  • ganglia 设计用于测量数以千计的节点, 资源消耗非常小。
    官网地址: http://ganglia.info/

  • open-falcon 小米发布的运维监控软件,高效率,高可用。时间较短,用户基数小。
    官网地址: http://open-falcon.org/

  • zabbix 跨平台,支持分布式,可以集中管理,可以画图,能够持久化保存数据,多条件告警,多种 API 接口,扩展性非常强。使用基数特别大,阿里云使用的就是 zabbix。
    官网地址: https://www.zabbix.com/

  • prometheus 是一个基于时间序列的数值数据的容器监控解决方案。
    官网地址: https://prometheus.io/

综合分析:zabbix 比较适合公司的监控需求,主要特点如下:

​1、丰富的模板

2、可以自定义监控项

3、完善的告警机制 **

4、适合分布式监控

5、集中管理系统

​6、开源、免费系统

正文完
星哥玩云-微信公众号
post-qrcode
 0
星锅
版权声明:本站原创文章,由 星锅 于2022-06-09发表,共计1284字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
【腾讯云】推广者专属福利,新客户无门槛领取总价值高达2860元代金券,每种代金券限量500张,先到先得。
阿里云-最新活动爆款每日限量供应
评论(没有评论)
验证码
【腾讯云】云服务器、云数据库、COS、CDN、短信等云产品特惠热卖中