2011年(7)
分类: 系统运维
2011-07-07 12:17:32
古人云:“学而不思则罔,思而不学则殆”,秉着学而思,思又学的死循环来说下我们今天的话题。
监控的目的到底是什么?我把它归纳为三点:
1.事前预防:
收集系统运行时的数据,便于提前发现问题的所在,或者为系统优化提供数据。
2.事中通知:
监控系统的状态(进程是否运行),如出现停止运行等异常情况,能及时通知。
3.事后调查:
在事前没有发现问题,事中也没有得到通知,事后你可以通过记录找到相应蛛丝马迹。
通过这样的划分,会让你对监控的规划更清晰。
贵公司在意哪点呢?如果你还有更好、更妙的划分方法,那就按你的来吧^_^ 。
知道了监控的用意分类,我们来谈谈选什么样的监控软件比较好。不如这样问吧,我们需要什么样的监控软件?
1.灵活性高
能随心所欲的定制自己的插件(不会编写脚本?你要定制做啥?靠,现在不会,以后不会啊!)。
2.分布式
最好呢支持分布式,虽然我现在检测的对象不多,但你能肯定我的对象不会超过[0-9]+万?
3.冗余性?
你讲笑话吧?监控软件有冗余功能?这该是系统可用性方面的吧?
4.直观性
“图胜表、表胜文”,说的是相对于表描述出来的东西,用图来形容,更加直观,便于理解和记忆,表胜文也如此,所以对于监控对象,我们需要的是直观,在直观,更直观。
5.简易性
方便的管理,易用性的操作,随心所用的使用(大有海阔凭鱼跃,天空任我飞的意境)。
最终我选了Nagios (不要问为什么,俺只知道这一款)