记一次linux服务器性能优化【分析篇】-GangLin

微笑看明天langanglin.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

GangLin_Lan

博客访问： 393803
博文数量： 25
博客积分： 496
博客等级：下士
技术积分： 815
用户组：普通用户
注册时间： 2011-09-01 11:18

文章分类

全部博文（25）

云计算（6）
系统监控（1）
职业规划（0）
oracle 学习笔记（3）

SQL学习（3）
shell 脚本（2）
linux 管理（13）
未分配的博文（0）

文章存档

2014年（2）

2013年（6）

2012年（17）

我的朋友

相关博文

记一次linux服务器性能优化【分析篇】

分类： LINUX

2012-07-10 14:56:48

前段时间服务器出现了一个奇怪的现象，一台配置不错的服务器，HP DL385 G7 （64G内存，2颗十二核CPU，连着一台存储）系统负载不规律的每过一段时间就非常高，高的时候维持在四五十，而这个时候呢，通过各种命令（top、vmstat、iostat、ifstat、sar）查看，各项资源都比较闲，一时间摸不着头脑。

系统资源没问题，只能从服务着手了，这台服务器主要跑nis和nfs服务，nis服务只是提供网络用户，因为这个服务导致负载升高的可能性不高，首先就想到nfs了。

首先介绍下服务器的环境，这台服务器通过nfs将存储上的数据共享给客户端服务器，开发人员在客户端服务器上工作，开发团队大概有100人。由于开发人员多，项目也多，完全有可能因为nfs服务的性能瓶颈影响系统性能。

记得曾经跟红帽售后提过一个问题，大概是：我nfs服务器要接受好几台客户端服务器的挂载，而且研发人员也多，负载高的话，nfs服务会不会受不了。当时售后给我的答复是“没关系，只要把nfs进程数调大来就可以了”，如此淡定的回答让我信服了。不过这个时候我nfs服务器进程已经调到80个进程了，难道还不够？于是把进程数改到160个，重启nfs服务，观察了一段时间，服务器负载降下来了，到现在再也没出现类似负载高的情况。

其实像这样规模的开发环境就不应该用一台服务器安装linux系统搭建nfs服务来共享文件，这样性能也不怎么好，而应该直接用一台中高端的存储设备，用存储自带的nfs共享功能，这样性能比系统搭建出来的nfs性能要好，这也是当初环境搭建方案的一个败笔。

调整nfs进程方法：

[root@server2 ~]# vim /etc/init.d/nfs
# Number of servers to be started by default
[ -z "$RPCNFSDCOUNT" ] && RPCNFSDCOUNT=8

默认是8个进程，一般在生产服务器上，在系统资源够的情况下，可以按照一颗CPU 8个nfs进程来算，我24颗CPU 160个进程也比较合理。如果有某个系统资源成瓶颈的时候，就要适当减少nfs进程数,否则也有可能因为nfs进程过多导致负载升高。

在网上有看到过一些帖子，有人问服务器CPU、内存、网络、IO都很闲，为什么负载居高不下呢，有个人回复到：“楼主服务器是不是跑的nfs服务?”，但是这个人没有回复怎么解决，也许他也遇到了类似的问题也没解决。我想说的是在查找性能瓶颈的时候，不能只盯着硬件资源看，有些服务本身也是存在瓶颈的，就像本文的问题，我觉得还是有不少人遇到的。

本来想模拟问题和解决过程的，但是手头没有测试机，虚拟机测试不出来，以后有机会再发个测试篇吧。

阅读(7032) | 评论(2) | 转发(4) |

上一篇：【转】Recovering a Lost LVM Volume Disk

下一篇：记一次linux服务器性能优化【测试篇】

给主人留下些什么吧！~~

exitgogo2012-08-07 19:47:20

非常好的一次经验总结，作者将问题现象描述的非常清楚，同时也给出了详细的解决过程，最后又引申出了对性能调整的思考，非常值得推荐！

回复 | 举报

chenlinbo55882012-07-11 16:05:33

实践出真知

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6