Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2168735
  • 博文数量: 317
  • 博客积分: 5670
  • 博客等级: 大校
  • 技术积分: 3677
  • 用 户 组: 普通用户
  • 注册时间: 2008-08-10 17:51
文章分类

全部博文(317)

文章存档

2016年(2)

2015年(44)

2014年(68)

2013年(42)

2012年(23)

2011年(51)

2010年(67)

2009年(17)

2008年(3)

分类: LINUX

2014-03-27 16:48:54

这个一些个人的总结,加上一些前辈的经验, 下面的优化总的来讲,在我使用的一年多中,还是相当有用的,优化和不优化还是比较明显的.

下面开始正题

目标

调优 Apache 之类服务器要达到的目标是什么?什么来量化这个调的指标.答案就是 QPS.

QPS = req/sec = 请求数/秒

就是每秒能处理多少请求数.我们平时老讲并发,并发不但指保持的连接数,还有处理了多少请求.所以这个是很关键的.
这个还会影响到什么啦,就是 PV ,基本上可以简单换算,每天总PV = QPS * 3600 * 8 ,就是算一天 8 个小时的样子.
 

 

峰值QPS
每天80%的访问集中在20%的时间里,这20%时间叫做峰值时间,如果有比较好的监控和信息收集系统.最好能用信息收集系统来处理和收集这些信息,然后量化来处理.

实际峰值流量为一天中流量最高的 5 分钟的流量
请求量的峰值为一天中请求量最高的 5 分钟的请求数.

可以这样来计算下面的内容,不过我们还是简单的使用 8/2 的分法来决定吧.

公式:

( 总PV数 * 80% ) / ( 每天秒数 * 20% ) = 峰值时间每秒请求数(QPS)

机器:

峰值时间每秒QPS / 单台机器的QPS   = 需要的机器


ExtendedStatus On 因为写入额外的时间标志,设off. 
MPM:worker-多进程多线程新型设计,适合高流量服务,但是不稳定,对象php之类支持非常差,不推荐, prefork-稳定,无线程,占用较多内存.
HostnameLookups off 关掉,这样少一dns查询,日志处理可以另外用软件. 
 
注释LoadMoule指令中不要的模块.  
一般说来,不需要的模块包括:
LoadModule auth_basic_module modules/mod_auth_basic.so
#LoadModule auth_digest_module modules/mod_auth_digest.so
LoadModule authn_file_module modules/mod_authn_file.so
#LoadModule authn_alias_module modules/mod_authn_alias.so
LoadModule authn_anon_module modules/mod_authn_anon.so
#LoadModule authn_dbm_module modules/mod_authn_dbm.so
LoadModule authn_default_module modules/mod_authn_default.so
LoadModule authz_host_module modules/mod_authz_host.so
LoadModule authz_user_module modules/mod_authz_user.so
LoadModule authz_owner_module modules/mod_authz_owner.so
LoadModule authz_groupfile_module modules/mod_authz_groupfile.so
#LoadModule authz_dbm_module modules/mod_authz_dbm.so
LoadModule authz_default_module modules/mod_authz_default.so
LoadModule ldap_module modules/mod_ldap.so
#LoadModule authnz_ldap_module modules/mod_authnz_ldap.so
LoadModule include_module modules/mod_include.so
LoadModule log_config_module modules/mod_log_config.so
LoadModule logio_module modules/mod_logio.so
LoadModule env_module modules/mod_env.so
LoadModule ext_filter_module modules/mod_ext_filter.so
LoadModule mime_magic_module modules/mod_mime_magic.so
LoadModule expires_module modules/mod_expires.so
LoadModule deflate_module modules/mod_deflate.so
LoadModule headers_module modules/mod_headers.so
LoadModule usertrack_module modules/mod_usertrack.so
LoadModule setenvif_module modules/mod_setenvif.so
LoadModule mime_module modules/mod_mime.so
#LoadModule dav_module modules/mod_dav.so
LoadModule status_module modules/mod_status.so
LoadModule autoindex_module modules/mod_autoindex.so 
LoadModule info_module modules/mod_info.so
#LoadModule dav_fs_module modules/mod_dav_fs.so
LoadModule vhost_alias_module modules/mod_vhost_alias.so
LoadModule negotiation_module modules/mod_negotiation.so
LoadModule dir_module modules/mod_dir.so
LoadModule actions_module modules/mod_actions.so
LoadModule speling_module modules/mod_speling.so
#比如:需要在~/username/下调试php可以将
#LoadModule userdir_module modules/mod_userdir.so
LoadModule alias_module modules/mod_alias.so
LoadModule rewrite_module modules/mod_rewrite.so
#LoadModule proxy_module modules/mod_proxy.so
#LoadModule proxy_balancer_module modules/mod_proxy_balancer.so
#LoadModule proxy_ftp_module modules/mod_proxy_ftp.so
#LoadModule proxy_http_module modules/mod_proxy_http.so
#LoadModule proxy_connect_module modules/mod_proxy_connect.so
LoadModule cache_module modules/mod_cache.so
LoadModule suexec_module modules/mod_suexec.so
LoadModule disk_cache_module modules/mod_disk_cache.so
LoadModule file_cache_module modules/mod_file_cache.so
LoadModule mem_cache_module modules/mod_mem_cache.so
#cgi程序用到,象awstats之类需要用到
LoadModule cgi_module modules/mod_cgi.so
LoadModule version_module modules/mod_version.so
 
上面只是我总结的部分用不到的,有大侠指点一下还有那些可以不要….

文件夹Directory的选项的优化
Options Indexes Includes FollowSymLinks ExecCGI
AllowOverride None

ExecCGI 允许执行 CGI 脚本.如果该选项没有设置,则 CGI 脚本将不能执行.如果没有必要最好不要开启,有可能会有安全性问题.
Includes  允许服务器端包含.服务器端包含允许一个 HTML 文件包含其他文件.这个平时用不到,他要检查每个html所以不要开启.
IncludesNOEXEC  允许服务器端包含,但 CGI 脚本中的 #exec 和 #include 指令无效.不常用,关掉
Indexes   如果 DirectoryIndex (如 index.html) 在请求的目录没存在的话,按一定方式显示目录内容列表.这个用的太多了,开启吧.
FollowSymLinks 最好关掉符号连接,Apache就必须执行额外的系统调用以验证符号连接.文件名的每一个组成部分都需要一个额外的调用.当打开这个选项时,Apache将检查每个请求中是否包含对符号连接的引用,这将对请求中包含的每个路径调用一次lstat()系统调用.在请求"/index.html"时,Apache将对"/www"、"/www/htdocs"、"/www/htdocs/index.html"执行lstat()调用.而且lstat()的执行结果不被缓存,因此对每一个请求都要执行一次.除非你准备使用符号连接,否则用 Options -FollowSymLinks 来关掉它. 用一个破折号引导,从而禁用此指令.
AllowOverride   这个选项,是开启如包括htaccess来进行权限控制,Apache必需首先在当前目录中查找是否存在这个文件,如果存在就解析这个文件并在当前目录中应用文件中的设置.更坏的是,Apache不仅要查看当前的目录,还要查看当前目录的所有上层目录是否包括htaccess文件以根据所有这些文件最终确定设置.例如请求"/index.html",则Apache会试图打开"/.htaccess"、"/www/.htaccess"、"/www/htdocs/.htaccess".其解决方法 AllowOverride None来关掉,当然,这样做静态化就只能写在VH的配置中了,禁用后设置文件仅在服务器启动时解析一次 .

 

DirectoryIndex index*,不要使用通配符,全用完整列表,如:DirectoryIndex index.cgi index.pl index.shtml index.html.当然,最少好些,明确的指定设置文件列表,放在最前最合理. 
 
启用了持久链接Keepalive,这样子进程将保持忙碌状态以等待被打开连接上的新请求.如果开启KeepAliveTimeout的默认值被设置为5秒.最好不要大于60秒. 

 
禁用日志 
写入日志信息是一个很花费时间的工作,尽管Apache保持日志文件的打开状态以节省打开文件的时间,但仍然得花费不少的时间.如果没有必要存储日志信息,你可以关闭这个选项以节省出更多的处理器时间,只需要在设置文件中把日志那一行注释掉就可以关掉它.当然,实在需要,最要加入另一个单盘来管理日志存储. 
  
 
静态内容方面  
    如果你的WEB服务器使用了大量静态内容或者你分别用两个WEB服务器处理动态和静态内容,那么你现在的主要目标就是缩短服务器发送被请求内容的响应时间,最简单的方法就是使用mod_cache缓存模块.你可以使用mod_disk_cache和mod_mem_cache来分别提供基于磁盘的缓存和基于内存的缓存. 
 
优化动态内容 
    动态内容可能是所有WEB服务器中最消费时间的部分,特别是使用CGI的时候,一个简单的程序都可能会把响应时间增加好几秒. 
    使用基于脚本的方案的一大好处是它们在Apache里装入了解释器,这就减少了执行时再装入解释器的时间,一些方案还把解析过的脚本缓存起来,这样下一次遇到同样的请求就可以直接执行而无需再次解析.当然也可以应用的服务分离,象使用php的fastcgi来在后面跑,前面给Web服务器. 
 
对特定系统的调整优化很复杂而且很花时间,而且你需要调整特定的脚本以利用优化的成果. 
 
不过对动态内容的优化效果是非常明显的,仅仅是把perl脚本的执行模式从CGI转到mod_perl就可以减少多达70%的执行时间,如果我们进一步,还可以使用到数据库的持久连接或在多次请求之间缓存信息,这对电子商务网站非常有用,它也减小了不同请求间重复装载信息的开销. 
 
总的来讲,网站的动态内容脚本和CGI是影响网站性能的最重要方面(所以好的程序员很重要),如果你管理一个典型的Apache服务器你会发现Apache响应一个传入连接以及最后把内容发送给客户的所花费的时间是以毫秒记的,而等待所需数据资源的时间常常达到几秒钟.

其它优化
 
 
可以把 Apache(httpd)的优先级改为 -15,这已经接近上限(优先级从最高的 -20 到最低的 19).可以从命令行使用这两个实用程序:

    * 要想停止现有服务并以优先级 -15 重新启动它,可以发出命令 nice -15 httpd
    * 要想避免停止服务,可以发出命令 renice -15 -p 1996

这里的差异是 renice 需要进程 ID(或 pid).如上所述,可以使用 top 查明 pid.nice 和 renice 是很灵活的程序

配置mod_expires模块(这个非常有用的优化哦) 
 
mod_expires可以减少20-30%左右的重复请求,让重复的用户对指定的页面请求结果都CACHE在本地,根本不向服务器发出请求.除开用户有发送no-cache才会更新,但要注意更新快的文件不要这么做. 
 
mod_expires的安装配置: 
ExpiresActive On
ExpiresDefault A60
ExpiresByType image/x-icon A2592000
ExpiresByType application/x-javascript A2592000
ExpiresByType text/css A2592000
ExpiresByType image/gif A604800
ExpiresByType image/png A604800
ExpiresByType image/jpeg A604800
ExpiresByType text/plain A604800
ExpiresByType application/x-shockwave-flash A604800
ExpiresByType video/x-flv A604800
ExpiresByType application/pdf A604800
ExpiresByType text/html A60

其实还有一个压缩,我就不写了,见我另外的那个文章<>
压缩比率可以高到70%,非常有用的.

另外高速的web服务,就可以把noatime参数加入/etc/fstab文件中
lnux文件系统当文件被访问,创建,更新的时候会保留纪录.默认的,当文件读写操作的时候,系统会更新last-time-read属性.因为写操作是比较耗费资源的操作,减少不必要的i/o可以整体上提高磁盘性能.
在挂接文件系统的时候,加入noatime参数可以禁止inode节点访问时间的修改.如果文件更新时间对于特定的应用不是很重要的话,比如web服务,就可以把noatime参数加入/etc/fstab文件中
比如:
/dev/sdb1 /mountlocation ext3 defaults,noatime 1 2
推荐利用单独的分区作为挂接点并打开noatime开关

也可以关掉的服务(这个好象谁都明白),apmd,autofs,cups,hpoj.isdn,pcmcia,rhnsd,sendmail,xfs(字体服务)

打开重用TCP/IP中的time-wait套接
sysctl -w net.ipv4.tcp_tw_reuse=1
启动TIME-WAIT 套接字状态的快速循环功能
sysctl =w net.ipv4.tcp_tw_recycle=1

阅读(1030) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~