nginx 502 Bad Gateway 错误问题收集-leanderlee-ChinaUnix博客

点滴记录，是前进的脚步lide.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

leanderlee

博客访问： 1196265
博文数量： 181
博客积分： 4968
博客等级：上校
技术积分： 1867
用户组：普通用户
注册时间： 2008-01-13 21:52

文章分类

全部博文（181）

nginx（8）
其它（8）
移动互联（4）
Linux开发（108）
C/C++/QT（19）
日语与日本文化（19）
English（6）
未分配的博文（9）

文章存档

2015年（2）

2013年（6）

2012年（22）

2011年（41）

2010年（27）

2009年（51）

2008年（32）

我的朋友

相关博文

nginx 502 Bad Gateway 错误问题收集

分类：系统运维

2011-12-30 14:24:25

Nginx php-fpm fast-cgi 502 Bad Gateway错误是FastCGI有问题，造成NGINX 502错误的可能性比较多。
将网上找到的一些和502 Bad Gateway错误有关的问题和排查方法列一下，先从FastCGI配置入手：

1.FastCGI进程是否已经启动

3.FastCGI执行时间过长
根据实际情况调高以下参数值
fastcgi_connect_timeout 300;
fastcgi_send_timeout 300;
fastcgi_read_timeout 300;

4.FastCGI Buffer不够
nginx和apache一样，有前端缓冲限制，可以调整缓冲参数
fastcgi_buffer_size 32k;
fastcgi_buffers 8 32k;
参见：

5.Proxy Buffer不够
如果你用了Proxying，调整
proxy_buffer_size 16k;
proxy_buffers 4 16k;
参见：

6.https转发配置错误
正确的配置方法

server_name ;
location /myproj/repos {
set $fixed_destination $http_destination;
if ( $http_destination ~* ^https(.*)$ )
{
set $fixed_destination http$1;
}
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header Destination $fixed_destination;
proxy_pass ;
}
参见：

7.查看php-fpm.log
错误请参看：
http://hi.baidu.com/dugu2008/blog/item/0d9e9bf8e8c13b08d8f9fd14.html

8.php的bug
请参看：

9.php-fpm.conf的配置
请参看

10.nginx.conf的rewrite-url规则等

11.php-fpm.pid
鄙人在/php/sbin/php-fpm 里面把
php_fpm_PID=/data1/php/logs/php-fpm.pid修改成
#php_fpm_PID=/data1/php/logs/php-fpm.pid
故猜想是用户权限的问题已php-fpm.conf里的用户启动该服务估计问题会消失

另外nginx 400 bad request 错误的原因和解决办法
在nginx.conf中，将client_header_buffer_size和large_client_header_buffers都调大，可缓解此问题。
其中主要配置是client_header_buffer_size这一项，默认是1k，所以header小于1k的话是不会出现问题的。
按我现在配置是：
client_header_buffer_size 16k;
large_client_header_buffers 4 64k;
这个配置可接收16k以下的header，在浏览器中cookie的字节数上限会非常大，所以实在是不好去使用那最大值。
本文转载自『北漂石头的博客』
http://www.niutian365.com/blog/

///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

一、NGINX 502错误排查
502 Bad Gateway错误是FastCGI有问题，造成 502错误的可能性比较多。将网上找到的一些和502 Bad Gateway错误有关的问题和排查方法列一下，先从FastCGI配置入手：
1.FastCGI进程是否已经启动
2.FastCGI worker进程数是否不够
运行 netstat -anpo | grep “php-cgi” | wc -l 判断是否接近FastCGI进程，接近配置文件中设置的数值，表明worker进程数设置太少
参见：http://blog.s135.com/post/361.htm
3.FastCGI执行时间过长
根据实际情况调高以下参数值
fastcgi_connect_timeout 300;
fastcgi_send_timeout 300;
fastcgi_read_timeout 300;
4.FastCGI Buffer不够
和apache一样，有前端缓冲限制，可以调整缓冲参数
fastcgi_buffer_size 32k;
fastcgi_buffers 8 32k;
参见：-502-gateway-error%E4%B8%80%E4%BE%8B/
5.Proxy Buffer不够
如果你用了Proxying，调整
proxy_buffer_size 16k;
proxy_buffers 4 16k;
参见：
6.https转发配置错误
正确的配置方法
server_name ;
location /myproj/repos {
set $fixed_destination $http_destination;
if ( $http_destination ~* ^https(.*)$ )
{
set $fixed_destination http$1;
}
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header Destination $fixed_destination;
proxy_pass
}
参见：
当然，还要看你后端用的是哪种类型的FastCGI，我用过的有php-fpm，流量约为单台机器40万PV(动态页面), 现在基本上没有碰到502。

7.php脚本执行时间过长
将php-fpm.conf的0s的0s改成一个时间
来源：http://blog.nowans.com/content/log.2008.10.29.229.html

二、Nginx 413错误的排查:修改上传文件大小限制
在上传时返回了413错误，查看log文件，显示的错误信息是:”413 Request Entity Too Large”, 于是在网上找了下“ 413错误”发现需要做以下设置：
在.conf增加 client_max_body_size的相关设置, 这个值默认是1m，可以增加到8m以增加提高文件大小限制；
如果运行的是php，那么还要检查php.ini，这个大小client_max_body_size要和php.ini中的如下值的最大值一致或者稍大，这样就不会因为提交数据大小不一致出现的错误。
post_max_size = 8M
upload_max_filesize = 2M

三、Nginx 400错误排查：HTTP头/Cookie过大
今天有人汇报的HTTP400错误，而且这个HTTP400错误并不是每次都会出现的，查了一下发现400错误是由于request header过大，通常是由于cookie中写入了较长的字符串所引起的。
解决方法是不要在cookie里记录过多数据，如果实在需要的话可以考虑调整在.conf中的(默认1k)
若cookie太大，可能还需要调整(默认4k)，该参数说明如下：
请求行如果超过buffer，就会报HTTP 414错误(URI Too Long)
接受最长的HTTP头部大小必须比其中一个buffer大，否则就会报400的HTTP错误(Bad Request)。

/////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

Nginx 502 Bad Gateway的含义是请求的PHP-CGI已经执行，但是由于某种原因（一般是读取资源的问题）没有执行完毕而导致PHP-CGI进程终止。
Nginx 504 Gateway Time-out的含义是所请求的网关没有请求到，简单来说就是没有请求到可以执行的PHP-CGI。

解决这两个问题其实是需要综合思考的，一般来说Nginx 502 Bad Gateway和php-fpm.conf的设置有关，而Nginx 504 Gateway Time-out则是与nginx.conf的设置有关。
而正确的设置需要考虑服务器自身的性能和访客的数量等多重因素。
以我目前的服务器为例子CPU是奔四1.5G的，内存1GB，CENTOS的系统，访客大概是50人左右同时在线。
但是在线的人大都需要请求PHP-CGI进行大量的信息处理，因此我将nginx.conf设置为：
fastcgi_connect_timeout 300s;
fastcgi_send_timeout 300s;
fastcgi_read_timeout 300s;
fastcgi_buffer_size 128k;
fastcgi_buffers 8 128k;#8 128
fastcgi_busy_buffers_size 256k;
fastcgi_temp_file_write_size 256k;
fastcgi_intercept_errors on;
这里最主要的设置是前三条，即
fastcgi_connect_timeout 300s;
fastcgi_send_timeout 300s;
fastcgi_read_timeout 300s;
这里规定了PHP-CGI的连接、发送和读取的时间，300秒足够用了，因此我的服务器很少出现504 Gateway Time-out这个错误。最关键的是php-fpm.conf的设置，这个会直接导致502 Bad Gateway和504 Gateway Time-out。
下面我们来仔细分析一下php-fpm.conf几个重要的参数：
php-fpm.conf有两个至关重要的参数，一个是”max_children”,另一个是”request_terminate_timeout”
我的两个设置的值一个是”40″，一个是”900″，但是这个值不是通用的，而是需要自己计算的。
计算的方式如下：
如果你的服务器性能足够好，且宽带资源足够充足，PHP脚本没有系循环或BUG的话你可以直接将”request_terminate_timeout” 设置成0s。0s的含义是让PHP-CGI一直执行下去而没有时间限制。而如果你做不到这一点，也就是说你的PHP-CGI可能出现某个BUG，或者你的宽带不够充足或者其他的原因导致你的PHP-CGI能够假死那么就建议你给”request_terminate_timeout”赋一个值，这个值可以根据你服务器的性能进行设定。一般来说性能越好你可以设置越高，20分钟-30分钟都可以。由于我的服务器PHP脚本需要长时间运行，有的可能会超过10 分钟因此我设置了900秒，这样不会导致PHP-CGI死掉而出现502 Bad gateway这个错误。

而”max_children”这个值又是怎么计算出来的呢？这个值原则上是越大越好，php-cgi的进程多了就会处理的很快，排队的请求就会很少。设置”max_children”也需要根据服务器的性能进行设定，一般来说一台服务器正常情况下每一个php-cgi所耗费的内存在20M左右，因此我的”max_children”我设置成40个，20M*40=800M也就是说在峰值的时候所有PHP-CGI所耗内存在800M以内，低于我的有效内存1Gb。而如果我的”max_children”设置的较小，比如5-10个，那么php-cgi就会“很累”，处理速度也很慢，等待的时间也较长。如果长时间没有得到处理的请求就会出现504 Gateway Time-out这个错误，而正在处理的很累的那几个php-cgi如果遇到了问题就会出现502 Bad gateway这个错误。

////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////

nginx中配置php fastcgi组解决莫名其妙的502 Bad Gateway错误

一般nginx搭配php都采用这样的方式：

location ~ \.php$ {
proxy_pass
fastcgi_param SCRIPT_FILENAME /data/_hongdou$fastcgi_script_name;
include fastcgi_params;
}

这个方式只能连接到一组spawn-fcgi开启的fastcgi，在服务器负载稍高时常常出现502 bad gateway错误。

起先怀疑这是php-cgi的进程开得太少，增加后仍然有反映时常有错，偶然间发现php-cgi会报出这样的错误：

zend_mm_heap corrupted

看来是php-cgi在执行某些代码时有问题，以致于该线程中止。

在服务器上可能还会看到php-cgi进程在不断变少，估计是出现错误的php-cgi的进程自动退出了。

php的问题总是不太容易能解决，所以在nginx方面想想办法，nginx的好处是它总是能爆出一些稀奇古怪的做法出来。

在nginx的proxy中，规避莫名其妙错误的办法无非是proxy到一个upstream的服务器组中，然后配置 proxy_next_upstream，让nginx遇到某种错误码时，自动跳到下一个后端上。这样，应用服务器即使不稳定，但是在nginx后面就变成了稳定服务。想到nginx的fastcgi和proxy是一路东西，所以proxy能用的经验，移植到fastcgi也能跑得起来。

照着这个思路，用spawn-fcgi多开同样一组php进程，所不同的仅仅是端口：

spawn-fcgi -a 127.0.0.1 -p 9000 -u nobody -f php-cgi -C 100
spawn-fcgi -a 127.0.0.1 -p 9001 -u nobody -f php-cgi -C 100

然后把fastcgi的这段配置改成用upstream的方式：

upstream backend {
server 127.0.0.1:9000;
server 127.0.0.1:9001;
}

location ~ \.php$ {
fastcgi_pass backend;
fastcgi_param SCRIPT_FILENAME /data/_hongdou$fastcgi_script_name;
include fastcgi_params;
}

检查配置结果正确，能跑起来；同时在服务器上netstat -n|grep 9000和grep 9001都有记录，证明连接无误；在前台查阅页面，一切运行正常。

这个配置是最简单的配置，既然能连接上upstream，那么很显然upstream的一些东西都可以拿来用，比如ip_hash、weight、max_fails等。

这样的配置在单机下不知能不能共享session，没有测试，如果有问题，可以加上ip_hash，或者配置php把session存进memcached中。

然后就是fastcgi_next_upstream的配置，nginx wiki中没有介绍到这个配置，查了一下，在nginx的CHANGES中有提到，而且出生年月是和proxy_next_upstream一样的。既然如此，那就照proxy_next_upstream一样配吧。一般按默认的值error timeout就可以工作，因为php出现502错误的异常是返回的500错误，所以我把fastcgi_next_upstream定为：

fastcgi_next_upstream error timeout invalid_header http_500;

通过这个配置，就可以基本杜绝任何时常性的500错误，出问题的几率会变小很多，如果客户反映仍然激烈，那么就多增加几组fastcgi进程。

以上配置能够杜绝由于php所引起的“莫名其妙”的时常性的502错误，同时可使nginx搭配php比从前方式更为强悍。假如nginx还是返回502错误，那这次就一定是出现服务器挂掉或其它严重问题的了。

===============================================================

Related posts:

Automatically convert apache .htaccess rewrite to Nginx Try this link add it to nginx.conf and then...
Nginx 0.7.x + PHP 5.2.6（FastCGI）+ MySQL 5.1 在128M小内存VPS服务器 VPS（全称Virtual Private Server）是利用最新虚拟化技术在一台物理服务器上创建多个相互隔离的虚拟私有主机。它们以最大化的效率共享硬件、软件许可证以及管理资源。对其用户和应用程序来讲，每一个VPS平台的运行和管理都与一***立主机完全相同，因为每一个VPS均可独立进行重启并拥有自己的root访问权限、用户、IP地址、内存、过程、文件、应用程序、系统函数库以及配置文件。 VPS服务器最重要的指标就是内存大小，多个VPS服务器可以共享一颗CPU，但不能共享同一块内存。内存越大，价格越贵。　　下面，以我的博客所在的VPS为例，介绍在128M内存下对 Nginx 0.7.x + PHP...
ps -ef | grep httpd | wc -l (check apache concurrent connections) ps -ef | grep httpd | wc -l 在Linux系统下查看apache的并发连接数: 即查看httpd的进程数（即prefork模式下Apache能够处理的并发请求数）：...
php-fpm 修改php-cgi进程数 vi /usr/local/php/etc/php-fpm.conf 修改这个里面的值 5 然后 /usr/local/php/sbin/php-fpm restart...
Apache 优化问：为什么服务器在连续运行多天后或访问峰值后，进程中的一个Apache.exe占用内存几百兆不减少？答：用记事本打开apache2\conf\httpd.conf，我在centos5上装了kloxo，找了半天 httpd.conf在 /etc/httpd/conf/目录下。查找MaxRequestsPerChild，将MaxRequestsPerChild 0改成MaxRequestsPerChild 50即可。　影响apache性能的几个重要参数(conf/httpd.conf中设置) KeepAlive　是否允许持续连接...

阅读(5682) | 评论(0) | 转发(0) |

上一篇：nginx优化突破十万并发

下一篇：linux下tomcat6.0配置SSL

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6