Apache服务的工作原理-呆若-ChinaUnix博客

天飞的博客htfchina.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

呆若

博客访问： 1845266
博文数量： 276
博客积分： 1574
博客等级：上尉
技术积分： 2894
用户组：普通用户
注册时间： 2010-05-26 23:23

个人简介

生活的美妙在于，不知道一下秒是惊艳还是伤神，时光流转，珍惜现在的拥有的时光

文章分类

全部博文（276）

opensuse（8）
HIVE（3）
hadoop,yarn,stor（1）
rundeck（3）
架构（1）
TCP/IP（4）
HTTP（1）
OpenStack（1）
ceph存储（13）
OVIRT（21）
CI持续集成（0）
ELK stack&n（4）
JINKENS（0）
ZABBIX（6）
Docker（8）
运维职业杂谈（1）
日志系统（1）
NGINX（3）
iptables（4）
SaltStack自动化（8）
C语言（1）
SHELL（17）
PHP（1）
Python（49）

Django（2）
监控（4）

cacti（3）
虚拟化技术（9）

VirtualBox（3）

Vagrant（0）

KVM（5）
服务（13）

其它（4）

redis（3）

NGINX（3）

memcached（1）

WEB服务（2）
网络（2）

LVS（0）

交换路由设备（2）
分布式文件系统（10）

GlusterFS（10）
运维自动化（1）

puppet（0）
汽车（3）

发动机技术（0）

用车（1）

驾驶技术（1）

底盘技术（0）
linux系统管理（25）

redhat.centos.fe（4）

系统调优（4）

monitor（1）
移动互联网（1）

手机系统（1）
feodra工作生活（48）

网络使用（2）

虚拟机（3）
未分配的博文（1）

文章存档

2017年（17）

2016年（131）

2015年（63）

2013年（2）

2012年（32）

2011年（31）

我的朋友

相关博文

Apache服务的工作原理

分类： LINUX

2016-05-09 10:28:11

服务器提供服务的方式

    网络服务器由于要同时为多个客户提供服务，就必须使用某种方式来支持这种多任务的服务方式。一般情况下可以有三种方式来选择，多进程方式、多线程方式及异步方式。其中，多进程方式中服务器对一个客户要使用一个进程来提供服务，由于在操作系统中，生成一个进程需要进程内存复制等额外的开销，这样在客户较多时的性能就会降低。为了克服这种生成进程的额外开销，可以使用多线程方式或异步方式。在多线程方式中，使用进程中的多个线程提供服务，由于线程的开销较小，性能就会提高。事实上，不需要任何额外开销的方式还是异步方式，它使用非阻塞的方式与每个客户通信，服务器使用一个进程进行轮询就行了。

   虽然异步方式最为高效，但它也有自己的缺点。因为异步方式下，多个任务之间的调度是由服务器程序自身来完成的，而且一旦一个地方出现问题则整个服务器就会出现问题。因此，向这种服务器增加功能，一方面要遵从该服务器自身特定的任务调度方式，另一方面要确保代码中没有错误存在，这就限制了服务器的功能，使得异步方式的Web 服务器的效率最高，但功能简单。例如Unix 平台上的thttpd 就是这样的一种服务器，然而由于它提供的功能少，只能是满足少部分人的需要。即便如此，thttpd 每隔一段时间还会出现一些问题，幸运的是，它出问题时从不是进入死循环，而是被操作系统杀死，这样就可以使用一个shell 循环立即重启动thttpd，从而基本不影响Web 服务。

   由于多线程方式使用线程进行任务调度，这样服务器的开发由于遵从标准，从而变得简单并有利于多人协作。然而多个线程位于同一个进程内，可以访问同样的内存空间，因此存在线程之间的影响，并且申请的内存必须确保申请和释放。对于服务器系统来讲，由于它要数天、数月甚至数年连续不停的运转，一点点错误就会逐渐积累而最终导致影响服务器的正常运转，因此很难编写一个高稳定性的多线程服务器程序。微软的IIS 就是使用的多线程方式，由于微软聚集了相当多优秀程序员，所以IIS 基本上还是值得信赖的，当然我也遇到过很多系统管理员，他们根据经验定期启动所管理的NT 服务器，以预防不可预料的Web 服务停止现象。

   多进程方式的优势就在于稳定性，因为一个进程退出的时候，操作系统会回收其占用的资源，从而使它不会留下任何垃圾。即便程序中出现错误，由于进程是相互隔离的，那么这个错误不会积累起来，而是随着这个进程的退出而得到清除。

   预生成进程方式的性能
   由于Apache 是采用的多进程方式提供服务，为了提高性能，Apache 采用了一种特别的方式，即预生成进程模型。分析多进程方式比其他两种方式开销大的主要原因，是对每一次客户请求，都要生成一个子进程以便进行处理，因此为了避免这种开销，可以使用预先生成的进程来提供服务，并且每个进程在提供一次服务之后也不会立即退出，而是仍然保留在系统中，等待下一次请求。
   这里就可以看出，在理想情况下，预先生成的多个进程可以全速回应相应数量的浏览器客户请求，而没有额外的性能开销，因此就完全可以和线程或异步方式相媲美。然而在实际运行当中，由于预先生成的进程毕竟要占用系统资源，如系统内存和CPU 处理能力，
   这样如果预先生成的进程超过需要，性能反而会降低。因此Apache 就采用了这样的一种策略，在系统中保持一定的空闲进程，当空闲进程较少时就自动生成，当空闲进程较多时就让一些进程退出。

   由于Apache 采用这样的预生成进程模型，就导致预先要生成多少进程、保留多少空闲进程、一个进程提供多少次服务等等成为与性能密切相关的问题，然而，这些设置都是与具体条件密切相关的。例如，越多的进程需要占用越多的内存，所分得的CPU 处理时间就越少，因此系统的物理内存和CPU 处理能力就决定了进程的最大数量。而Apache 提供的基本配置是为了适应大多数情况，在客户请求较少时也不占用过多资源，因此并不是最高性能的设置。而大多数Web 服务器测试的条件下，服务器的内存、CPU 处理能力都不是问题，甚至内存大到足以将所有要访问的文档都可以放在系统缓冲中，因而无须考虑磁盘处理能力，这种情况和实际应用完全不同。因此，SGI 的一位开发者通过调整设置，并使用他自己对Apache 代码的一些改动，在同一个SGI Origin 200 服务器上使用SPECweb96 进行测试，调整后的服务器可以比原始设置提高10 倍的速度，当然这是针对SPECweb96 这个测试程序进行的调整，在实际使用中不可能会有这样巨大的差别。这至少从侧面说明了测试结果并不是绝对的。

   此外，Apache 的另一个特点是它的功能特别丰富，而每种功能通常就需要进行特别的处理，这会影响Apache 的性能，然而对于具体的情况，却不是每种特性都是必要的，因此可以通过减少这些功能来增加性能。此外，操作系统的调整对于增强Apache 的性能也是非常重要的。如何根据服务器的实际情况调整操作系统以及Apache 的参数，这些内容在Apache 的文档中都有非常详细的描述。这些文档包含在每个Apache 安装文件中，也可以直接从它的主页得到。

   Apache 2.0 展望
   虽然Apache 服务器使用预生成进程的方式提高了服务器的性能，然而，程方式本身的不足仍然存在，随着访问数量的增多，进程方式比其他两种方式需要消耗更多的内存和CPU 处理能力，这就限制了单台计算机提供更大负载的能力。如果在低端计算机上想服务更多的请求的话，使用异步方式的thttpd 更为适合。例如，一台512MB 内存双CPU的Linux 服务器提供1000 个并发访问时，其负载就会变得相当高，常常会由于内存用光而无法运行程序，这种情况是由于Linux 重视物理内存，不重视交换空间的原因，如果使用同样配置的FreeBSD 作操作系统，情况会有所改变，然而此时由于需要进行内存交换，就无法达到最优性能了。
   因此，这些情况下为了支持更改的负载，完全采用进程方式就不太合适了，而应该利用线程节约资源的优点。
   然而，在即将到来的Apache 2.0 中，一切都会变得更完美，Apache 2.0 将充分考虑到进程带来的稳定性特征，以及线程带来高效率的特点。它会预生成多个进程，而每个进程中使用多个线程提供Web 服务。由于存在多个进程，即使一个进程死了也不会影响整个Web 服务。对于不支持进程的操作系统，如Windows，那么就使用多个线程提供服务，反之也是一样。然而，只有同时支持线程和进程的操作系统，才能充分利用Apache 2.0带来的稳定性和高负载能力。
   事实上当前的Apache 并不是与线程无关，Windows 版本的Apache 是使用线程的，但按照Apache 文档的说法，Windows 版本的Apache 性能并不好，主要原因是它在移植过程中是使用的Windows 的POSIX 子系统，而Windows 本身的有些特性效率更高。而在Apache2.0 中，使用了APR（Apache Portable Run-time）特性，这种特性对不同的操作系统提供了一个抽象层，以便Apache 能利用Windows 的一些非POSIX 的特性。

Apache2.0在性能上的改善最吸引人.在支持POSIX线程的Unix系统上,Apache可以通过不同的MPM运行在一种多进程与多线程相混合的模式下,增强部分配置的可扩充性能.相比于Apache1.3,2.0版本做了大量的优化来提升处理能力和可伸缩性,并且大多数改进在默认状态下即可生效.但是在编译和运行时刻,2.0也有许多可以显著提高性能的选择.

MPM（Multi-ProcessingModules,多道处理模块）是Apache2.0中影响性能的最核心特性.
我主要来说一下prefork和worker工作模式。
prefork的工作原理

如果不用“——with-mpm”显式指定某种MPM,prefork就是Unix平台上缺省的MPM.它所采用的预派生子进程方式也是Apache1.3中采用的模式.prefork本身并没有使用到线程,2.0版使用它是为了与1.3版保持兼容性;另一方面,prefork用单独的子进程来处理不同的请求,进程之间是彼此独立的,这也使其成为最稳定的MPM之一.

prefork的工作原理是,控制进程在最初建立“StartServers”个子进程后,为了满足MinSpareServers设置的需要创建一个进程,等待一秒钟,继续创建两个,再等待一秒钟,继续创建四个……如此按指数级增加创建的进程数,最多达到每秒32个,直到满足MinSpareServers设置的值为止.这就是预派生（prefork）的由来.这种模式可以不必在请求到来时再产生新的进程,从而减小了系统开销以增加性能.

worker的工作原理

相对于prefork,worker是2.0版中全新的支持多线程和多进程混合模型的MPM.由于使用线程来处理,所以可以处理相对海量的请求,而系统资源的开销要小于基于进程的服务器.但是,worker也使用了多进程,每个进程又生成多个线程,以获得基于进程服务器的稳定性.这种MPM的工作方式将是Apache2.0的发展趋势.

worker的工作原理是,由主控制进程生成“StartServers”个子进程,每个子进程中包含固定的ThreadsPerChild线程数,各个线程独立地处理请求.同样,为了不在请求到来时再生成线程,MinSpareThreads和MaxSpareThreads设置了最少和最多的空闲线程数;而MaxClients设置了所有子进程中的线程总数.如果现有子进程中的线程总数不能满足负载,控制进程将派生新的子进程.

Worker模式下所能同时处理的请求总数是由子进程总数乘以ThreadsPerChild值决定的,应该大于等于MaxClients.如果负载很大,现有的子进程数不能满足时,控制进程会派生新的子进程.默认最大的子进程总数是16,加大时也需要显式声明ServerLimit（最大值是20000）

需要注意的是,如果显式声明了ServerLimit,那么它乘以ThreadsPerChild的值必须大于等于MaxClients,而且MaxClients必须是ThreadsPerChild的整数倍,否则Apache将会自动调节到一个相应值（可能是个非期望值）.

   采用传统的生成子进程的方式来提供服务的Apache，适合服务比较复杂的情况，但性能没有单进程的服务器高，尤其在高负载的情况下更是如此。

   对于重负载的Apache专业服务器，可以简单的将以上SpareServers、StartServers、MaxClients四值设相同。

   Squid是单进程的服务器，处理静态页面比Apache提高一个数量级。同样，Windows平台的IIS在静态页面上的处理性能也较Apache高几倍的性能（但不如Apache稳定）。
   如有两台Apache服务器，第一个Apache服务器只提供静态内容和代理服务，可将MaxClients设置较大。第二个Apache服务器要提供消耗处理器能力的动态网页服务，要将MaxClients设置较小。

   因此，应充分利用Apache的原理特性及工作平台，合理地配置以下参数，在运行时动态调整，以使Apache达到最合理的状态：

   MaxKeepAliveRequests 100
   # 一次连接可以进行的HTTP请求的最大请求次数（比如客户一次连接中请求几十个页面）。

   MinSpareServers 5
   MaxSpareServers 10
   # Apache预先生成多个空余的子进程驻留系统中，用于处理客户请求。两个参数用于设置最小的空余子进程数量及最多的空闲子进程数量。

   StartServers 5
   # 设置httpd启动时启动的子进程数量。这个参数应设置为前两个值之间的一个数值。小于或大于前两个数值都没有意义。

   MaxClients 150
   # 服务器支持的最大并发访问的客户数。
   # 应根据服务器的物理内存及处理器动态调整。

   MaxRequestsPerChild 30
   # 每个子进程处理的服务请求次数。超过此值后，子进程副本退出，重新由原始的htttd进程中重新复制一个干净的副本，以提高系统的稳定性。
   # 对于静态页面，产生的内存垃圾少，可设置为2000，甚至更高；如服务器载入各种不同的功能模块，产生内存垃圾多，可将此值降低。
   # 对于高稳定的系统，如FreeBSD，可设成1000，或更高。

转自：http://blog.tianya.cn/blogger/post_show.asp?BlogID=40003&PostID=4585547

阅读(1232) | 评论(0) | 转发(0) |

上一篇：python 多进程与子进程

下一篇：PERFORMANCE OF APACHE 2.4 WITH THE EVENT MPM COMPARED TO NGINX

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6