1. ifconifg 看丢包率,ethtool看是否是duplex 和speed(遇到过网线质量差和intel 网卡驱动导致丢包和半双工,100Mbps)
2. w/uptime看load, 不要超过cpu cores。
3. df -h 看inode,假如ext3这种非动态变化inode的文件系统,对于大量小文件的,要注意inode会塞满了,建议用resizefs。
4. vmstat 里si/so不为0即可,就说明Memory是足够的(不要看free -m这个,linux总是最大可能的利用内存,当不够的时候会释放出来,所以free 会看到buffer/cache占了大部分内存),bi/bo是由于OS的kernel机制,即使内存够用也会产生swap,极端情况下可以关闭kernel的swap,vm.swappiness=0 但万一内存真不够用了会OOM。(out of memory)
5. iostat 看r/s,w/s, avgqu-sz/await/until。包括iowait。
6. IPOS ,根据转速一般在100-200,做raid0会double。无论如何优化也不会超过这个。
7. iptref 看网卡
8. tcpdump, 看网络连接情况,比较有用。比如mysql has gone away,这种就可以tcpdump来看到底是不是网路设置造成的。
多说一句,nagios监控机器太多用nsca分布式代替nrpe,否则一次检查会delay或拥塞,告警的及时性不能保证。
下边是与服务器性能测试有关的:
iozone/sysbench/ab/netpref(测试网络IDC 丢包率,响应时间,吞吐量等)
运行状况良好的:
cpu
user+sys<70%
mem
swap in/out =0
disk
iowait <20%
[root@admin ~]# free -m
total used free shared buffers cached
Mem: 7862 7172 689 0 333 1534
-/+ buffers/cache: 5303 2558
Swap: 9536 134 9402
实际使用的内存是5303, 5303+buffers+cached=7172
阅读(849) | 评论(0) | 转发(0) |