Chinaunix首页 | 论坛 | 博客
  • 博客访问: 240587
  • 博文数量: 69
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 15
  • 用 户 组: 普通用户
  • 注册时间: 2013-02-23 13:55
文章分类

全部博文(69)

文章存档

2016年(11)

2013年(58)

我的朋友

分类: 嵌入式

2013-03-30 18:10:44

做 NAT 服务器,当负载过大时,总出现
引用:
Oct 17 14:56:04 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Down
Oct 17 14:56:08 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Up 100 Mbps Full Duplex
Oct 17 14:56:09 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Down
Oct 17 14:56:15 server kernel: e1000: eth0: e1000_watchdog: NIC Link is Up 100 Mbps Full Duplex


网卡反复 UP、DOWN,甚至导致系统自动重启
这个 e1000_watchdog 是做什么用的?为何有如此现象?如何不让他自动 UP、DOWN ?

  回复于:2005-10-18 12:56:21

watchdog这个好像是检测到坏桢认为可能硬件出现故障复位硬件,不过e1000吃不住流量的情况应该不大,估计是线制作的不合格导致大流量时坏桢严重,或者有电气干扰等。

  回复于:2005-10-18 12:58:25

对了,ifconfig看一下是不是相应网卡出现很多errors的包

  回复于:2005-10-18 13:11:46

很奇怪呢,RX-ERR RX-DRP RX-OVR,这三项都是 0
是这样的,这台机器上还运行其他服务,CPU 一直比较高,会不会是没有过多的 CPU 来负责处理数据包造成的?

还有,我如果修改源代码,注释掉硬件复位那段代码可不可以?会不会有副作用?


cat /proc/interrupts  看下是否和这相似,注释掉硬件复位那段代码没问题,
          CPU0       CPU1       CPU2       CPU3 
 0:  347275720  347745526  340396987  340996245    IO-APIC-edge  timer 
 1:        284        789        878        556    IO-APIC-edge  i8042 
 8:          0          0          0          1    IO-APIC-edge  rtc 
 9:          0          0          0          0   IO-APIC-level  acpi 
14:          1          0         20         19    IO-APIC-edge  ide0 
15:      87104     399199       5819     328406    IO-APIC-edge  libata 
169:          0          0          0          0   IO-APIC-level  uhci_hcd 
177:          0          0          0          0   IO-APIC-level  uhci_hcd 
185:          0          0          0          0   IO-APIC-level  ehci_hcd 
209:     186220    5466568     211081    5950435   IO-APIC-level  ioc0 
217:   27184131          0          0        157   IO-APIC-level  eth0 
225:          0          0   51742411         29   IO-APIC-level  eth1 
NMI:          0          0          0          0 
LOC: 1376397708 1376397707 1376397706 1376397705 
ERR:          0 
MIS:          0


  回复于:2005-10-18 15:22:24

e1000 是千兆的网卡, 100M应该没事呀? 
 watchdog 好象是用来检测什么东东的一个计时, 我觉得是不是你的 switch 受不了呀? 因为 switch 如果不行了, 网卡一样会认为网络 down 呀.

  回复于:2005-10-18 15:29:41

引用:原帖由 "jackylau"]不会是负载过大的原因.我们单位做iptv,负荷比你重多了吧,也是e1000
 发表:


你们的 iptv 服务器的 CPU 负载高吗?
我的服务器 CPU 一直很高
或者网络里面有人捣乱的话,用 dos 工具去弄网关这台机器,一样也会 over。。。。
  回复于:2005-10-18 16:54:33

watchdog是软件狗阿,它是在设备或程序不正常时reboot这设备/程序的,网卡的软狗是监测驱动的情况的,检测到错误为方式tx huang来 做的强制reset.软件狗就起动了可见、缓冲区不够大是造成watchdog起动的结果,他在缓冲区满时reboot这设备,你cpu对两网卡的管理明 显不对,你的网卡很可能不是厂家的驱动,不过这reboot不象cpu造成的,15:     108463    IO-APIC- edge  ide1, 倒是你IDE占cpu太多了,hdparm -c1 /dev/hda ,再hdparm  -i /dev/hda看下,还有 你lsmod把结果列出来把。还有你的驱动是intel下的吗?请更新驱动,应该就ok了。若是linux自带的就快UP到intel的驱动把

阅读(1529) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~