Centos出现丢包问题解决办法-niao5929-ChinaUnix博客

birdofpreybirdofprey.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

niao5929

博客访问： 7344944
博文数量： 3857
博客积分： 6409
博客等级：准将
技术积分： 15948
用户组：普通用户
注册时间： 2008-09-02 16:48

个人简介

迷彩潜伏隐蔽伪装

文章分类

全部博文（3857）

大数据计算（149）
随想（82）
编程语言（372）

python（3）

lisp（0）

JAVA C++（2）

GOLANG（0）
数据库（115）
高可用集群（412）

分布式系统（26）

SDN（0）

细胞节点（78）

分布式网络（5）
Linux（1172）

SHELL（10）

网络（209）
未分配的博文（1555）

文章存档

2017年（5）

2016年（63）

2015年（927）

2014年（677）

2013年（807）

2012年（1241）

2011年（67）

2010年（7）

2009年（36）

2008年（28）

我的朋友

最近访客

推荐博文

Centos出现丢包问题解决办法

分类：

2012-09-14 23:34:01

原文地址：Centos出现丢包问题解决办法作者：飞鸿无痕

Centos出现丢包问题解决办法

环境介绍：

系统: CENTOS 5.5 64 bit

软件：nginx+mysql+php+NFS

故障排查：

早上突然收到nagios服务器check_icmp的报警，报警显示一台网站服务器的内网网络有问题。因为那台服务器挂载了内网的NFS，因此内网的网络就采用nagios的check_icmp来做监控。

赶紧登录服务器进行排查。首先使用ping 内网IP的方式查看内网的连通性，ping的过程中出现丢包现象，信息如下:

64 bytes from 10.1.1.1: icmp_seq=34 ttl=255 time=0.928 ms

64 bytes from 10.1.1.1: icmp_seq=35 ttl=255 time=1.01 ms

ping: sendmsg: Operation not permitted

显示ping不被允许，奇怪，防火墙上明明开通了icmp的协议。有问题先看日志，日志文件一般会有所记录，tail –f /var/log/messages，发现大量的如下内容：

Sep 13 09:11:21 dowload_server1 kernel: printk: 261 messages suppressed.

Sep 13 09:11:21 dowload_server1 kernel: ip_conntrack: table full, dropping packet

发现是当前会话数已经满了，因此出现丢包现象。这里对ip_conntrack做一下简单的介绍：IP_conntrack表示连接跟踪数据库(conntrack database)，代表NAT机器跟踪连接的数目，连接跟踪表能容纳多少记录是被一个变量控制的，它可由内核中的ip-sysctl函数设置。每一个跟踪连接表会占用350字节的内核存储空间，时间一长就会把默认的空间填满，那么默认空间是多少？在内存为64MB的机器上是4096,内存为128MB是 8192,内存为256MB是16384

通过如下命令查看当前的会话数：

cat /proc/net/ip_conntrack | wc –l

或者使用：

cat /proc/sys/net/ipv4/netfilter/ip_conntrack_count

使用如下命令查看设置的最大会话数

cat /proc/sys/net/ipv4/ip_conntrack_max

解决办法：

发现确实已经达到了最大会话数，通过google发现，可以直接调大用户的最大会话数，命令为：

echo "102400" > /proc/sys/net/ipv4/ip_conntrack_max

执行此命令后，不在丢包了，ping也正常了。但是这样设置不会永久保存，当系统重启后设置会丢失，因此需要保存到/etc/sysctl.conf，在/etc/sysctl.conf中加入：net.ipv4.ip_conntract_max =102400，然后执行/sbin/sysctl –p刷新内核参数即可，如果出现error: "net.ipv4.ip_conntract_max" is an unknown key报错的话，需要加载ip_conntract模块，使用modprobe ip_conntrack加载，使用lsmod | grep ip_conntrack查看模块是否加载。

终极解决：

为了使彻底解决此问题，还需要再设置一个东西，那就是会话连接超时变量，这个参数设置太长的话就会导致会话连接数不断增加，默认是设置为432000秒，很显然这个值太大了，通过如下命令设置小一点：

echo 21600 >/proc/sys/net/ipv4/netfilter/ip_conntrack_tcp_timeout_established

设置成21600也就是6小时，这样会自动清除6小时候后的无效链接。记得将这句话加到自动启动文件/etc/rc.local文件中去。

故障总结：

此次故障显示我们必须加强服务器的监控，这样才能第一时间获取故障问题并在第一时间解决，减少此类问题给公司造成损失。另外出现问题多看日志，日志往往能看出问题的蛛丝马迹，通过日志我们能更快地定位问题，从而找到问题的解决办法。

阅读(1038) | 评论(0) | 转发(0) |

上一篇：BT eMule 的终极封锁办法

下一篇：ubuntu系统使用minicom终端操作说明

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6