lepus支持自定义策划书word模板下载吗?

posts - 1,&
comments - 1,&
trackbacks - 0
分分钟拯救监控知识体系
监控&zabbix
监控是整个运维乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供详实的数据用于追查定位问题。&目前业界有很多不错的开源产品可供选择。选择一款开源的监控系统,是一个省时省力,效率最高的方案。当然对监控不是很明白的朋友们,看了以下文章可能会对监控整个体系有比较深刻的认识。
ps:本文内容较多,文章篇幅很长,可以先收藏,后续慢慢阅读。
作者介绍:&徐亮伟,江湖人称标杆徐,曾负责大规模集群架构自动化运维工作。擅长自动化运维,并且在分布式、Python自动化、云计算虚拟化等领域有较深入研究。个人博客:&笔者Q:、&架构师群:
感谢我的老师赵班长的才有了此篇文章的诞生。&感谢为本供图小伙伴:周玉强、顾云、陈荣华。&感谢为本文校对指正的小伙伴:万永振、周玉强、陈荣华。
0 监控目标
我们先来了解什么是监控,监控的重要性以及监控的目标,当然每个人所在的行业不同、公司不同、业务不同、岗位不同、对监控的理解也不同,但是我们需要注意,监控是需要站在公司的业务角度去考虑,而不是针对某个监控技术的使用。&
1.对系统不间断实时监控:实际上是对系统不间断的实时监控(这就是监控)
2.实时反馈系统当前状态:我们监控某个硬件、或者某个系统,都是需要能实时看到当前系统的状态,是正常、异常、或者故障
3.保证服务可靠性安全性:我们监控的目的就是要保证系统、服务、业务正常运行
4.保证业务持续稳定运行:如果我们的监控做得很完善,即使出现故障,能第一时间接收到故障报警,在第一时间处理解决,从而保证业务持续性的稳定运行。
1 监控方法
既然我们了解到了监控的重要性、以及监控的目的,那么下面我们需要了解下监控有哪些方法。
1.了解监控对象:我们要监控的对象你是否了解呢?比如CPU到底是如何工作的?&2.性能基准指标:我们要监控这个东西的什么属性?比如CPU的使用率、负载、用户态、内核态、上下文切换。&3.报警阈值定义:怎么样才算是故障,要报警呢?比如CPU的负载到底多少算高,用户态、内核态分别跑多少算高?&4.故障处理流程:收到了故障报警,那么我们怎么处理呢?有什么更高效的处理流程吗?
2 监控核心
我们了解了监控的方法、监控对象、性能指标、报警阈值定义、以及故障处理流程几步骤,当然我们更需要知道监控的核心是什么?&
1.发现问题:当系统发生故障报警,我们会收到故障报警的信息&2.定位问题:故障邮件一般都会写某某主机故障、具体故障的内容,我们需要对报警内容进行分析,比如一台服务器连不上:我们就需要考虑是网络问题、还是负载太高导致长时间无法连接,又或者某开发触发了防火墙禁止的相关策略等等,我们就需要去分析故障具体原因。&3.解决问题:当然我们了解到故障的原因后,就需要通过故障解决的优先级去解决该故障。&4.总结问题:当我们解决完重大故障后,需要对故障原因以及防范进行总结归纳,避免以后重复出现。
3 监控工具
下面我们需要选择一款合适公司业务的监控工具进行监控,这里我对监控工具进行了简单的分类&
老牌监控:&MRTG(Multi Route Trffic Grapher)是一套可用来绘制网络流量图的软件,由瑞士奥尔滕的Tobias Oetiker与Dave Rand所开发,以GPL授权。&MRTG最好的版本是1995年推出的,用perl语言写成,可跨平台使用,数据采集用SNMP协议,MRTG将手机到的数据通过Web页面以GIF或者PNG格式绘制出图像。
Grnglia是一个跨平台的、可扩展的、高性能的分布式监控系统,如集群和网格。它基于分层设计,使用广泛的技术,用RRDtool存储数据。具有可视化界面,适合对集群系统的自动化监控。其精心设计的数据结构和算法使得监控端到被监控端的连接开销非常低。目前已经有成千上万的集群正在使用这个监控系统,可以轻松的处理2000个节点的集群环境。
Cacti(英文含义为仙人掌)是一套基于PHP、MySQL、SNMP和RRDtool开发的网络流量监测图形分析工具,它通过snmpget来获取数据使用RRDtool绘图,但使用者无须了解RRDtool复杂的参数。提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结构、主机设备以及任何一张图,还可以与LDAP结合进行用户认证,同时也能自定义模板。在历史数据展示监控方面,其功能相当不错。&Cacti通过添加模板,使不同设备的监控添加具有可复用性,并且具备可自定义绘图的功能,具有强大的运算能力(数据的叠加功能)
Nagios是一个企业级监控系统,可监控服务的运行状态和网络信息等,并能监视所指定的本地或远程主机状态以及服务,同时提供异常告警通知功能等。&Nagios可运行在Linux和UNIX平台上。同时提供Web界面,以方便系统管理人员查看网络状态、各种系统问题、以及系统相关日志等&Nagios的功能侧重于监控服务的可用性,能根据监控指标状态触发告警。&目前Nagios也占领了一定的市场份额,不过Nagios并没有与时俱进,已经不能满足于多变的监控需求,架构的扩展性和使用的便捷性有待增强,其高级功能集成在商业版Nagios XI中。
Smokeping主要用于监视网络性能,包括常规的ping、www服务器性能、DNS查询性能、SSH性能等。底层也是用RRDtool做支持,特点是绘制图非常漂亮,网络丢包和延迟用颜色和阴影来标示,支持将多张图叠放在一起,其作者还开发了MRTG和RRDtll等工具。&Smokeping的站点为:
开源监控系统OpenTSDB用Hbase存储所有时序(无须采样)的数据,来构建一个分布式、可伸缩的时间序列数据库。它支持秒级数据采集,支持永久存储,可以做容量规划,并很容易地接入到现有的告警系统里。&OpenTSDB可以从大规模的集群(包括集群中的网络设备、操作系统、应用程序)中获取相应的采集指标,并进行存储、索引和服务,从而使这些数据更容易让人理解,如Web化、图形化等。
Zabbix是一个分布式监控系统,支持多种采集方式和采集客户端,有专用的Agent代理,也支持SNMP、IPMI、JMX、Telnet、SSH等多种协议,它将采集到的数据存放到数据库,然后对其进行分析整理,达到条件触发告警。其灵活的扩展性和丰富的功能是其他监控系统所不能比的。相对来说,它的总体功能做的非常优秀。&从以上各种监控系统的对比来看,Zabbix都是具有优势的,其丰富的功能、可扩展的能力、二次开发的能力和简单易用的特点,读者只要稍加学习,即可构建自己的监控系统。
小米的监控系统:open-falcon。open-falcon的目标是做最开放、最好用的互联网企业级监控产品。
OWL是TalkingData公司推出的一款开源分布式监控系统
现在市场上有很多不错的第三方监控,比如:监控宝、监控易、听云、还有很多云厂商自带监控,但是在这里我们不打算着重介绍,如果想了解三方监控可自行上官网咨询。(避免说广告植入)
4 监控流程
上面介绍了这么多,那么到底选择什么监控工具最合适呢,我这里推荐几款开源监控工具:zabbix、Open-Falcon、LEPUS天兔(专用于监控数据库)。&但是本文还是基于zabbix来构建整个监控体系生态圈。&那么下面我们就来聊聊,zabbix的整个流程:&
1.数据采集:&Zabbix通过SNMP、Agent、ICMP、SSH、IPMI等对系统进行数据采集&2.数据存储:&Zabbix存储在MySQL上,也可以存储在其他数据库服务&3.数据分析:&当我们事后需要复盘分析故障时,zabbix能给我们提供图形以及时间等相关信息,方面我们确定故障所在。&4.数据展示:&web界面展示、(移动APP、java_php开发一个web界面也可以)&5.监控报警:电话报警、邮件报警、微信报警、短信报警、报警升级机制等(无论什么报警都可以)&6.报警处理:当接收到报警,我们需要根据故障的级别进行处理,比如:重要紧急、重要不紧急,等。根据故障的级别,配合相关的人员进行快速处理。
5 监控指标
我们上面了解了监控方法、目标、流程、也了解了监控有哪些工具,可能有人会疑惑,我们具体要监控写什么东西,那么我在这里进行了分类整理:&
硬件监控&系统监控&应用监控&网络监控&流量分析&日志监控&安全监控&API监控&性能监控&业务监控&
5.1 硬件监控
早期我们通过机房巡检的方式,查看硬件设备灯光闪烁情况判断是否故障,这样非常浪费人力,并且是重复性无技术含量的工作,大家懂得。&
当然我们现在可以通过IPMI对硬件详细情况进行监控,并对CPU、内存、磁盘、温度、风扇、电压等设置报警设置报警阈值(自行对监控报警内容编写合理的报警范围)&&
IPMI工具无法获取到硬件的状态,可以借助MegaCli工具探测Raid磁盘队列状态&zabbix提供IPMI监控模板:Zabbix IPMI Interface&系统自带的IPMI模板只能监控,风扇,电源,和部分温度
5.2 系统监控
中小型企业基本全是Linux服务器,那么我们肯定是要监控起系统资源的使用情况,系统监控是监控体系的基础。
监控主要对象:&
CPU有几个重要的概念:上下文切换、运行队列和使用率。
这也是我们CPU监控的几个重点指标。&通常情况,每个处理器的运行队列不要高于3,CPU 利用率中用“户态/内核态”比例维持在70/30,空闲状态维持在50%,上下文切换要根据系统繁忙程度来综合考量。
针对CPU常用的工具有:htop、top、vmstat、mpstat、dstat、glances
zabbix提供系统监控模板:Zabbix Agent Interface
CPU整体状态
上下文切换
内存:通常我们需要监控内存的使用率、SWAP使用率、同时可以通过zabbix描绘内存使用率的曲线图形发现某服务内存溢出等。
针对内存常用的工具有: free、top、vmstat、glances
内存使用率
IO分为磁盘IO和网络IO。除了在做性能调优我们要监控更详细的数据外,那么日常监控,只关注磁盘使用率、磁盘吞吐量、磁盘写入繁忙程度,网络也是监控网卡流量即可。
常用工具有:iostat、iotop、df、iftop、sar、glances&
磁盘使用率
磁盘读/写吞吐
磁盘读/写次数
网卡进出口流量
TCP11种状态信息
其它的系统监控还有运行的进程端口、进程数、登陆用户、Open File等(详细查看zabbix自带OS Linux模板)&
其他相关监控
5.3 应用监控
把硬件监控和系统监控研究明白后,我们进一步操作是需要登陆到服务器上查看服务器运行了哪些服务,都需要监控起来。&应用服务监控也是监控体系中比较重要的内容,例如:&LVS、Haproxy、Docker、Nginx、PHP、Memcached、Redis、MySQL、Rabbitmq等等,相关的服务都需要使用zabbix监控起来。
nginx_status
PHP-FPM_status
Redis_status
笔者之前写过服务监控详细的操作过程,这里就不一一展示,详情访问:
zabbix提供应用服务监控:Zabbix Agent UserParameter&zabbix提供的Java监控:Zabbix JMX Interface&percona提供MySQL数据库监控:percona-monitoring-plulgins
5.4 网络监控
作为一个针对全国用户的电商网站,时刻掌握各地到机房的网络状态也是必须的。&网络监控是我们构建监控平台是必须要考虑的,尤其是针对有多个机房的场景,各个机房之间的网络状态,机房和全国各地的网络状态都是我们需要重点关注的对象,那么如何掌握这些状态信息呢?我们需要借助于网络监控工具Smokeping。
Smokeping 是rrdtool的作者Tobi Oetiker的作品,是用Perl写的,主要是监视网络性能,www 服务器性能,dns查询性能等,使用rrdtool绘图,而且支持分布式,直接从多个agent进行数据的汇总。
同时,由于自己监控点比较少,还可以借助很多商业的监控工具,比如监控宝、听云、基调、博瑞等。同时这些服务提供商还可以帮助你监控CDN的状态。
5.5 流量分析
网站流量分析对于运维人员来说,更是一门必须掌握的知识了。比如对于一家电商公司来说:&通过对订单来源的统计和分析,可以了解我们在某个网站上的广告投入有没有收到预期的效果。&可以区分不同地区的访问人数、甚至商品交易额等。
百度统计、google分析、站长工具等等,只需要在页面嵌入一个js即可。&但是,数据始终是在对方手中,个性化定制不方便,于是google出一个叫piwik的开源分析工具
5.6 日志监控
通常情况下,随着系统的运行,操作系统会产生系统日志,应用程序会产生应用程序的访问日志、错误日志,运行日志,网络日志,我们可以使用ELK来进行日志监控。
对于日志监控来说,最见的需求就是收集、存储、查询、展示,开源社区正好有相对应的开源项目:&logstash(收集) + elasticsearch(存储+搜索) + kibana(展示)&我们将这三个组合起来的技术称之为ELK Stack,所以说ELK Stack指的是Elasticsearch、Logstash、Kibana技术栈的结合。
如果收集了日志信息,那么如果部署更新有异常出现,可以立即在kibana上看到。&
Elk日志展示
当然也可以通过Zabbix过滤错误日志来进行告警。&
zabbix日志展示
5.7 安全监控
虽然Linux开源的安全产品不少,比如四层iptables,七层WEB防护nginx+lua实现WAF,最后将相关的日志都收至Elkstack,通过图形化进行不同的攻击类型展示。但是始终是一件比较耗费时间,并且个人效果并不是很好。这个时候我们可以选择接入第三方服务厂商。&
某某三方安全
三方厂商提供全面的漏洞库,涵盖服务、后门、数据库、配置检测、CGI、SMTP等多种类型&全面检测主机、Web应用漏洞自主挖掘和行业共享相结合第一时间更新0day漏洞,杜绝最新安全隐患
5.8 API监控
由于API变得越来越重要,很显然我们也需要这样的数据来分辨我们提供的 API是否能够正常运作。&监控API接口GET、POST、PUT、DELETE、HEAD、OPTIONS的请求&可用性、正确性、响应时间为三大重性能指标
三方API监控
5.9 性能监控
全面监控网页性能,DNS响应时间、HTTP建立连接时间、页面性能指数、响应时间、可用率、元素大小等&zabbix提供URL监控:Zabbix Web 监控&
Zabbix站点监控
终端响应时间
第三方监控监控大盘。各类图表一目了然,全面体现网页性能健康状况。
5.10 业务监控
没有业务指标监控的监控平台,不是一个完善的监控平台,通常在我们的监控系统中,必须将我们重要的业务指标进行监控,并设置阈值进行告警通知。比如电商行业:
每分钟产生多少订单,&每分钟注册多少用户,&每天有多少活跃用户,&每天有多少推广活动,&推广活动引入多少用户,&推广活动引入多少流量,&推广活动引入多少利润,&等等 重要指标都可以加入zabbix上,然后通过screen展示。&注:由于业务监控图表,涉及到隐私的数据太多,就不截图。
6 监控报警
故障报警通知的方式有很多种,当然我们最常用的还是短信,邮件&
7 报警处理
一般报警后我们故障如何处理,首先,我们可以通过告警升级机制先自动处理,比如nginx服务down了,可以设置告警升级自动启动nginx。&但是如果一般业务出现了严重故障,我们通常根据故障的级别,故障的业务,来指派不同的运维人员进行处理。&当然不同业务形态、不同架构、不同服务可能采用的方式都不同,这个没有一个固定的模式套用。&
8 面试监控
在运维面试中,常常会被问题监控相关的问题,那么这个问题到底该如何来回答,我针对本文给大家提供了一个简单的回答思路。
1.硬件监控。&通过SNMP来进行路由器交换机的监控(这些可以跟一些厂商沟通来了解如何做)、服务器的温度以及其他,可以通过IPMI来实现。当然如果没有硬件全都是云,直接跳过这一步骤。&2.系统监控。&如CPU的负载,上下文切换、内存使用率、磁盘读写、磁盘使用率、磁盘inode使用率。当然这些都是需要配置触发器,因为默认太低会频繁报警。&3.服务监控。&比如公司用的LNMP架构,nginx自带Status模块、PHP也有相关的Status、MySQL的话可以通过percona官方工具来进行监控。Redis这些通过自身的info获取信息进行过滤等。方法都类似。要么服务自带。要么通过脚本来实现想监控的内容,以及报警和图形功能。&4.网络监控。&如果是云主机又不是跨机房,那么可以选择不监控网络。当然你说我们是跨机房以及如何如何。推荐使用smokeping来做网络相关的监控。或者直接交给你们的网络工程师来做,因为术业有专攻。&5.安全监控。&如果是云主机可以考虑使用自带的安全防护。当然也可以使用iptables。如果是硬件,那么推荐使用硬件防火墙。使用云可以购买防DDOS,避免出现故障导致down机一天。如果是系统,那么权限、密码、备份、恢复等基础方案要做好。web同时也可以使用Nginx+Lua来实现一个web层面的防火墙。当然也可以使用集成好的openresty。&6.Web监控。&web监控的话题其实还是很多。比如可以使用自带的web监控来监控页面相关的延迟、js响应时间、下载时间、等等。这里我推荐使用专业的商业软件,监控宝或听云来实现。毕竟人家全国各地都有机房。(如果本身是多机房那就另说了)7.日志监控。&如果是web的话可以使用监控Nginx的50x、40x的错误日志,PHP的ERROR日志。其实这些需求无非是,收集、存储、查询、展示,我们其实可以使用开源的ELKstack来实现。Logstash(收集)、elasticsearch(存储+搜索)、kibana(展示)&8.业务监控。&我们上面做了那么多,其实最终还是保证业务的运行。这样我们做的监控才有意义。所以业务层面这块的监控需要和开发以及总监开会讨论,监控比较重要的业务指标,(需要开会确认)然后通过简单的脚本就可以实现,最后设置触发器即可&9.流量分析。&平时我们分析日志都是拿awk sed xxx一堆工具来实现。这样对我们统计ip、pv、uv不是很方便。那么可以使用百度统计、google统计、商业,让开发嵌入代码即可。为了避免隐私也可以使用piwik来做相关的流量分析。&10.可视化。&通过screen以及引入一些第三方的库来美化界面,同时我们也需要知道,订单量突然增加、突然减少。或者说突然来了一大波流量,这流量从哪儿来,是不是推广了,还是被攻击了。可以结合监控平来梳理各个系统之间的业务关系。&11.自动化监控。&如上我们做了那么多的工作,当然不能是一台一台的来加key实现。可以通过Zabbix的主动模式以及被动模式来实现。当然最好还是通过API来实现。
12.分布式监控
9 监控总结
真正想做到更完整的监控体系,目前的开源软件,确实无法很好的满足,有条件的公司都开始自己开发自己的监控系统,比如小米开源的Open-Falcon。&也有比较好的开源的监控框架如Sensu等,再加上influxdb、grafana可以用来定制符合自己企业的监控平台。
当然我说的还是很简单,经验有限、思路也仅能提供这么多。&以上就是我分享对监控的一些方法和心得。(老鸟勿喷)
阅读(...) 评论() &员工为什么加要加入工会_百度文库
您的浏览器Javascript被禁用,需开启后体验完整功能,
享专业文档下载特权
&赠共享文档下载特权
&100W篇文档免费专享
&每天抽奖多种福利
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
员工为什么加要加入工会
阅读已结束,下载本文需要
定制HR最喜欢的简历
你可能喜欢基于LePUS的设计模式CASE工具的设计与实现--《计算机工程与设计》2004年11期
基于LePUS的设计模式CASE工具的设计与实现
【摘要】:设计模式是软件工程界的热点,在面向对象软件设计中扮演着重要角色,自动化支持设计模式非常必要。为此,以LePUS语言为基础,提出了一个支持设计模式的CASE工具原型模型,该工具支持设计模式代码框架的自动生成,更重要的是该工具可以通过加入新的设计模式而得以扩展。此外,详细分析了实现中的源程序内部表示、设计模式实例化、动态模板生成技术等关键技术。
【作者单位】:
【分类号】:TP311.52
欢迎:、、)
支持CAJ、PDF文件格式,仅支持PDF格式
【相似文献】
中国期刊全文数据库
徐礼坤,陶世群;[J];山西大学学报(自然科学版);1992年03期
许幼鸣,徐锦,赵文耘,钱乐秋;[J];计算机工程;1999年03期
李英军,吕建,刘鸿儒;[J];计算机学报;2000年01期
艾丽蓉,刘西洋,何华灿;[J];西北工业大学学报;2000年02期
付岩;白硕;李国杰;;[J];计算机科学;2000年09期
杨炳儒,张德政;[J];计算机工程与应用;2001年13期
万剑怡,薛锦云;[J];计算机工程;2001年05期
陆庆达,李劲宇;[J];计算机应用研究;2001年08期
万剑怡,孙永强,薛锦云;[J];计算机研究与发展;2002年03期
彭苏萍,孙连英,张德政;[J];计算机工程与应用;2002年01期
中国重要会议论文全文数据库
王阳;蒋宠伟;孙淑芝;;[A];中国营养学会第六届临床营养学术会议论文摘要汇编[C];1997年
张建平;陶全心;;[A];第五届空间结构学术交流会论文集[C];1990年
姚明初;;[A];工程结构可靠性——中国土木工程学会桥梁及结构工程学会第七届学术会议论文集[C];1987年
张佐汉;姚明初;;[A];工程结构可靠性——中国土木工程学会桥梁及结构工程学会第七届学术会议论文集[C];1987年
王备战;赵荣椿;聂炎明;;[A];信号与信息处理技术——第一届信号与信息处理联合学术会议论文集[C];2002年
陈懋戍;;[A];第六届全国计算机应用联合学术会议论文集[C];2002年
李永平;李亚波;邹华;;[A];第六届全国计算机应用联合学术会议论文集[C];2002年
罗娟;曹阳;郑刚;何振;;[A];2003年通信软件技术学术年会论文集[C];2003年
孙俊;叶建平;;[A];2003年通信软件技术学术年会论文集[C];2003年
王欣华;陈晖;张甲恩;;[A];中国土木工程学会第九届土力学及岩土工程学术会议论文集(下册)[C];2003年
中国重要报纸全文数据库
林之诠;[N];金融时报;2000年
肖谦;[N];中国电力报;2001年
李祖平;[N];中国纺织报;2001年
陈少敬;[N];电脑报;2001年
刘乃森;[N];光明日报;2001年
首都经贸大学信息学院
门志勇;[N];计算机世界;2002年
梁邦勇;[N];计算机世界;2002年
华市;[N];中华读书报;2002年
秦炜;[N];证券日报;2003年
杨立波 黄小原;[N];中国冶金报;2003年
中国博士学位论文全文数据库
沈延森;[D];南京航空航天大学;2001年
王冰洋;[D];南京航空航天大学;2002年
曹江辉;[D];南京航空航天大学;2002年
谢规良;[D];西北工业大学;2003年
柯清超;[D];华南师范大学;2003年
徐小良;[D];浙江大学;2003年
王斌;[D];中南大学;2003年
李玲玲;[D];河北工业大学;2004年
陈澎;[D];中国科学院研究生院(成都计算机应用研究所);2006年
洪荣晶;[D];东南大学;2006年
中国硕士学位论文全文数据库
佟立峰;[D];北京工业大学;2001年
章冬梅;[D];北京工业大学;2002年
熊丽;[D];武汉理工大学;2002年
杨烜会;[D];厦门大学;2002年
张俐;[D];河海大学;2003年
干明;[D];西南交通大学;2003年
庄乾伟;[D];中国地质大学(北京);2003年
温科秋;[D];广西大学;2003年
何华海;[D];中国科学院研究生院(软件研究所);2002年
柯善军;[D];重庆大学;2003年
&快捷付款方式
&订购知网充值卡
400-819-999313款运维监控工具之开源工具介绍
监控作为重要性最高的机制之一,在一定程度上也遭到了我们的忽视。
无处不在的灾难,如果有监控系统的预警,那么,我们就有机会迅速启动灾难响应方案或者着手排除复杂的性能故障,这对于任何规模的企业而言都极具巨大的实际价值。
有效的运行监测体系,最终离不开相关技术平台的支撑,而我们需要了解监测技术平台。
在接下来的两节课里面,我们会说到开源工具介绍和商用运维监控系统这两块。
下面我就来来详细说说开源工具介绍。
官方网站:https://www.zabbix.com/
Zabbix是一个基于WEB界面的提供分布式系统监控以及网络监控功能的企业级开源运维平台,也是目前国内互联网用户中使用最广的监控软件,云智慧遇到的85%以上用户在使用Zabbix做监控解决方案。
入门容易、上手简单、功能强大并且开源免费是云智慧对Zabbix的最直观评价。Zabbix易于管理和配置,能生成比较漂亮的数据图,其自动发 现功能大大减轻日常管理的工作量,丰富的数据采集方式和API接口可以让用户灵活进行数据采集,而分布式系统架构可以支持监控更多的设备。理论上,通过 Zabbix提供的插件式架构,可以满足企业的任何需求。
可以直接查看我们zabbix相关板块:https://www.abcdocker.com/abcdocker/category/zabbix/
用户群:90%以上中小型的泛互联网企业
1. 支持多平台的企业级分布式开源监控软件
2. 安装部署简单,多种数据采集插件灵活集成
3. 功能强大,可实现复杂多条件告警,
4. 自带画图功能,得到的数据可以绘成图形
5. 提供多种API接口,支持调用脚本
6. 出现问题时可自动远程执行命令(需对agent设置执行权限)
1. 项目批量修改不方便
2. 入门容易,能实现基础的监控,但是深层次需求需要非常熟悉Zabbix并进行大量的二次定制开发,难度较大;
3. 系统级别报警设置相对比较多,如果不筛选的话报警邮件会很多;并且自定义的项目报警需要自己设置,过程比较繁琐(但是网上的模板比较,也可以使用模板导入的方法);
4. 缺少数据汇总功能,如无法查看一组服务器平均值,需进行二次开发;
5. 数据报表需要特殊二次开发定义;
官方网站:https://www.nagios.org/
Nagios是一款开源的企业级监控系统,能够实现对系统CPU、磁盘、网络等方面参数的基本系统监控,以及 SMTP,POP3,HTTP,NNTP等各种基本的服务类型。另外通过安装插件和编写监控脚本,用户可以实现应用监控,并针对大量的监控主机和多个对象 部署层次化监控架构。
Nagios最大的特点是其强大的管理中心,尽管其功能是监控服务和主机的,但Nagios自身并不包括这部分功能代码,所有的监控、告警功能都是由相关插件完成的。
用户群:适合复杂IT环境的企业
1. 出错的服务器、应用和设备会自动重启,自动日志滚动
2. 配置灵活,可以自定义shell脚本,通过分布式监控模式
3. 支持以冗余方式进行主机监控,报警设置多样
4. 命令重新加载配置文件无需打扰Nagios的运行
1. 事件控制台功能很弱,插件易用性差
2. 对性能、流量等指标的处理不给力
3. 看不到历史数据,只能看到报警事件,很难追查故障原因
4. 配置复杂,初学者投入的时间、精力和成本比较大
官方网站:http://ganglia.info/
Ganglia是加州大学伯克利分校发起的一个开源集群监控项目,设计之初是用于监控数以千计的网络节点。Ganglia是一个跨平台可扩展的,高性能计算系统下的分布式监控系统。它已被广泛移植到各种操作系统和处理器架构上。
用户群:适用于大型服务器集群用户。
1. 适合监控系统性能,通过曲线很容易见到每个节点的工作状态
2. 可以自定义监控项,监控展示有表格和图像两种,支持手机版
3. 部署方便,通过不同的分层管理上万台机器,无需逐个添加配置
1. 没有内置的消息通知系统
2. 没有报警机制,出现问题不能够及时报警
官方网站:http://grafana.org/
Grafana可以用在任何需要数据可视化的地方,如果有一天老板需要你做一份漂亮的业务数据图表,你无需头疼用什么绘图库去开发,你要做的仅仅是将业务数据稍作加工存入Grafana支持的DataSource,点几下鼠标即可配制出一份完美的数据图表。
因为这款工具除了绘图比较好看,其他的功能不如我们的zabbix。我们这里就简单的说一下,以后会有相关文档,请继续关注abcdocker!
Zenoss Core是Zenoss的开源版本,其商用版本为ZenossEnterprise。作为企业级智能监控软件,Zenoss Core允许IT管理员依靠单一的WEB控制台来监控网络架构的状态和健康度。Zenoss Core的强大能力来自于深入的列表与配置管理数据库,以发现和管理公司IT环境的各类资产。Zenoss同时提供与CMDB关联的事件和错误管理系统, 以协助提高各类事件和提醒的管理效率。
1. Zenoss比较出色的地方在于它的Dashboard,可以配置很多portlet
2. 每个用户的界面都是分开管理的,自定义dashboard不会影响其他用户
3. 强大监控功能支持服务器、路由交换、防火墙、存储、数据库、中间件监控
4. 采用基于HBASE的opentsdb存储任意时间段的数据
5. 将状态监控,性能监控,资源管理,良好的报告机制进行有机的整合
1. 对资源要求较高,即使只管理少数几台设备,也需要消耗大量硬件及内存等附加资源。
2. 针对windows系统,开源版只提供SNMP,通过WMI检测CPU,Disk,软硬件和性能只在收费版提供。
Open-falcon
Open-falcon是小米运维团队从互联网公司的需求出发,根据多年的运维经验,结合SRE、SA、DEVS的使用经验和反馈,开发的一套面向互联网的企业级开源监控产品。
Open-falcon架构
用户群:目前有几十家企业用户不同程度使用。
1. 自动发现,支持falcon-agent、snmp、支持用户主动push、用户自定义插件支持
2. 支持每个周期上亿次的数据采集、告警判定、历史数据存储和查询
3. 高效的portal、支持策略模板、模板继承和覆盖、多种告警方式、支持callback调用
4. 单机支撑200万metric的上报、归档、存储
5. 采用rrdtool的数据归档策略,秒级返回上百个metric一年的历史数据
6. 多维度的数据展示,用户自定义Screen 7. 通过各种插件目前支持Linux、Windows、Mysql、Redis、Memache、RabbitMQ和交换机监控。
由于发布时间较短,很多基础的服务监控插件(如Tomcat、apache等)还不支持,很多功能还在不断完善中,另外由于缺少专门的支持,虽然有开放社区,但是解决问题的效率相对较低。
官方网站:http://www.cacti.net
提示:近几年cacti和nagios已经基本被zabbix代替
Cacti 在英文中的意思是仙人掌的意思,Cacti是一套基于PHP、MySQL、SNMP及RRDTool开发的网络流量监测图形分析工具。它通过snmpget来获取数据,使用 RRDtool绘画图形,它的界面非常漂亮,能让你根本无需明白rrdtool的参数能轻易的绘出漂亮的图形。而且你完全可以不需要了解RRDtool复杂的参数。它提供了非常强大的数据和用户管理功能,可以指定每一个用户能查看树状结 构、host以及任何一张图,还可以与LDAP结合进行用户验证,同时也能自己增加模板,让你添加自己的snmp_query和!功能非常强大完善,界面友好。可以说,Cacti将rrdtool的所有“缺点”都补足了!下图是Cacti运行的主界面,
Cacti 工作流程
步骤一,snmp协议收集远程服务器的数据
步骤二,将snmp收集的数据内容保存到rrd数据库中
步骤三,若用户查看某台设备上的流量或其它状态信息 步骤四,在mysql数据库中查找该设备对应的rra数据库文件的名称
步骤五,通过rrdtool命令进行绘图即可
提示:cacti的图确实不好找,只能官网截一个
还有很多不出门的监控工具,这里就不在介绍了。
天兔开源监控(只适用于mysql、redis、oracle)
官方网站:http://www.lepus.cc/   
简洁、直观、强大的开源数据库监控系统,MySQL/Oracle/MongoDB/Redis一站式性能监控,让数据库监控更简单
中文开源软件,里面监控mysql和redis可以精确到sql语句
因为只有监控数据库和非关系数据库,监控项不能统一,不能结合其他监控平台
文章转自:https://www.abcdocker.com/abcdocker/2721
责任编辑:
声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
今日搜狐热点

我要回帖

更多关于 策划书word模板下载 的文章

 

随机推荐