[精彩]负载过大时,e1000_watchdog反复UP、DOWN的问题-赵宏远-ChinaUnix博客

赵宏远的ChinaUnix博客

首页　| 　博文目录　| 　关于我

赵宏远

博客访问： 242096
博文数量： 69
博客积分： 0
博客等级：民兵
技术积分： 15
用户组：普通用户
注册时间： 2013-02-23 13:55

文章分类

全部博文（69）

个人（11）
未分配的博文（58）

文章存档

2016年（11）

2013年（58）

我的朋友

相关博文

[精彩]负载过大时,e1000_watchdog反复UP、DOWN的问题

分类：嵌入式

2013-03-30 18:10:44

原文地址：[精彩]负载过大时,e1000_watchdog反复UP、DOWN的问题作者：lantianyu520

做 NAT 服务器，当负载过大时，总出现
引用：
Oct 17 14:56:04 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Down
Oct 17 14:56:08 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Up 100 Mbps Full Duplex
Oct 17 14:56:09 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Down
Oct 17 14:56:15 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Up 100 Mbps Full Duplex

网卡反复 UP、DOWN，甚至导致系统自动重启
这个 e1000_watchdog 是做什么用的？为何有如此现象？如何不让他自动 UP、DOWN ？

回复于：2005-10-18 12:56:21

watchdog这个好像是检测到坏桢认为可能硬件出现故障复位硬件，不过e1000吃不住流量的情况应该不大，估计是线制作的不合格导致大流量时坏桢严重，或者有电气干扰等。

回复于：2005-10-18 12:58:25

对了，ifconfig看一下是不是相应网卡出现很多errors的包

回复于：2005-10-18 13:11:46

很奇怪呢，RX-ERR RX-DRP RX-OVR，这三项都是 0
是这样的，这台机器上还运行其他服务，CPU 一直比较高，会不会是没有过多的 CPU 来负责处理数据包造成的？

还有，我如果修改源代码，注释掉硬件复位那段代码可不可以？会不会有副作用？

cat /proc/interrupts  看下是否和这相似，注释掉硬件复位那段代码没问题，
          CPU0       CPU1       CPU2       CPU3
0:  347275720  347745526  340396987  340996245    IO-APIC-edge  timer
1:        284        789        878        556    IO-APIC-edge  i8042
8:          0          0          0          1    IO-APIC-edge  rtc
9:          0          0          0          0   IO-APIC-level  acpi
14:          1          0         20         19    IO-APIC-edge  ide0
15:      87104     399199       5819     328406    IO-APIC-edge  libata
169:          0          0          0          0   IO-APIC-level  uhci_hcd
177:          0          0          0          0   IO-APIC-level  uhci_hcd
185:          0          0          0          0   IO-APIC-level  ehci_hcd
209:     186220    5466568     211081    5950435   IO-APIC-level  ioc0
217:   27184131          0          0        157   IO-APIC-level  eth0
225:          0          0   51742411         29   IO-APIC-level  eth1
NMI:          0          0          0          0
LOC: 1376397708 1376397707 1376397706 1376397705
ERR:          0
MIS:          0

回复于：2005-10-18 15:22:24

e1000 是千兆的网卡, 100M应该没事呀?
watchdog 好象是用来检测什么东东的一个计时, 我觉得是不是你的 switch 受不了呀? 因为 switch 如果不行了, 网卡一样会认为网络 down 呀.

回复于：2005-10-18 15:29:41

引用：原帖由 "jackylau"]不会是负载过大的原因.我们单位做iptv,负荷比你重多了吧,也是e1000
发表：

你们的 iptv 服务器的 CPU 负载高吗？
我的服务器 CPU 一直很高
或者网络里面有人捣乱的话，用 dos 工具去弄网关这台机器，一样也会 over。。。。
回复于：2005-10-18 16:54:33

watchdog是软件狗阿，它是在设备或程序不正常时reboot这设备/程序的，网卡的软狗是监测驱动的情况的，检测到错误为方式tx huang来做的强制reset.软件狗就起动了可见、缓冲区不够大是造成watchdog起动的结果，他在缓冲区满时reboot这设备，你cpu对两网卡的管理明显不对，你的网卡很可能不是厂家的驱动，不过这reboot不象cpu造成的，15:     108463    IO-APIC- edge  ide1，倒是你IDE占cpu太多了，hdparm -c1 /dev/hda ,再hdparm  -i /dev/hda看下,还有你lsmod把结果列出来把。还有你的驱动是intel下的吗？请更新驱动，应该就ok了。若是linux自带的就快UP到intel的驱动把

阅读(1542) | 评论(0) | 转发(0) |

上一篇：shell 守护进程的实现

下一篇：深入解析NTFS文件系统

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6