监控做了这么多年了,终于还是要走到容量规划上面来了。。
目前的监控主要集中在2块:
1. 报警
2. 性能数据的存储和展示。
但是现状是:我们已经存储了足够的性能数据了,比如:机器硬件相关的 CPU,disk usage,load,interface traffic,memory&swap,tcp status,另外,业务相关的:PV,session,网络相关的traffic,pps等,虽然这些数据为故障的查找做了很大的贡献,但总觉得其作用应该更大。
终于,上面有了做容量规划的意思,这些存储已久的数据终于有了发挥他真正价值的时候了!
初步设想如下:
1. 对应用分类。
根据机器硬件相关的数据,结合业务的核心指标,将机器进行分类,看到底负责某业务的机器是属于 CPU依赖?内存依赖?还是disk IO依赖或者网络依赖??
2. 设定我们可以接受的应用容量上限
有了对应用的分类,然后就需要测试在不同系统压力下,应用的表现与关键依赖的关系,比如说web应用,与CPU息息相关,OK,我们就可以测试,在不同PV下,CPU的表现如何,据前人的经验,CPU的平均利用率如果达到70%,基本上已经是属于很高的利用率了(之前国家的超级计算机90%的利用率没可比性。。)
3. 计算容量规划
现在我们已有了当前系统的类型,又有了容量规划的最终目标,OK,已经可以开始实时容量规划了。通过CPU利用率曲线做拟合,计算出到达70%的设计CPU利用率的时间,然后结合web PV增长率,就比较容易得出我们当前系统的机器CPU利用率在什么时候达到上限,在达到上限之前,就是我们系统的扩容的时候了。。。
OK,总体设想已经搞定,后续将针对1,2,3条开始详细阐述。。有兴趣的不妨持续关注下
阅读(2449) | 评论(0) | 转发(0) |