Chinaunix首页 | 论坛 | 博客
  • 博客访问: 103550842
  • 博文数量: 19283
  • 博客积分: 9968
  • 博客等级: 上将
  • 技术积分: 196062
  • 用 户 组: 普通用户
  • 注册时间: 2007-02-07 14:28
文章分类

全部博文(19283)

文章存档

2011年(1)

2009年(125)

2008年(19094)

2007年(63)

分类:

2008-04-10 22:16:47

作者:邵宪昌 郑立 李凌云  

---- 计算机网络的应用已经越来越普遍。大多数信息管理系统都通过网络实现信息的处理、存储和传送,大大提高了工作效率,并为企业带来巨大的经济效益。利用计算机进行各项业务工作或办公自动化,已经离不开网络。在这种情况下,及时排除网络故障,也显得越来越重要。我们把组建计算机网络系统和日常维护工作中,经常遇到的问题及其解决办法总结出来,主要包括网卡的正确安装配置、网线的正确连接和广域网的连接测试。

一、网卡正确安装配置

---- 我们的信息系统采用了SCO OpenServer 5.0.5操作系统,首先要确保主机所用的网卡被该操作系统支持,并且安装了正确的网卡驱动程序。如果在正确安装配置后,重启系统时出现错误信息或没有反应,使用硬件配置命令hwconfig也检查不到网卡,那么说明系统根本没有检测到网卡,或者在软硬件上的配置上有错误。可以从以下几个方面进行检查。

---- 1.设置是否正确
---- 用网卡所带的设置程序,在纯DOS环境下正确地设置其中断(IRQ)、I/O地址和线路类型(五类线或细缆)等。有些网卡有跳线,要根据其说明书设置跳线,确保跳线的设置正确无误。对于新型网卡,需要进入EISA或PCI设置程序,使其设为自动检测。在Unix下用hwconfig命令可以检测出配置有无冲突,命令格式为:
---- #hwconfig -hc
---- 其中参数h表示使用短格式显示硬件配置结果,c表示检查硬件配置冲突情况,包括I/O地址、DMA通道和中断3个参数。
---- 如果系统显示出所有硬件的配置结果后,在最后一行有如下提示:
---- No obvious conflicts in hardware settings

---- 即硬件设置中不存在冲突,则表明硬件配置没有冲突。在系统启动时,也可能发现诸如“card not found(没有发现网卡)”和“unable to start(不能启动)”等错误。这说明软件配置同硬件有冲突。只要使用net config或ifconfig这2个常用网络配置命令正确配置网卡后,重连内核,重新启动系统即可。也可以用ping命令或网络状态检查命令netstat来检查资源冲突。先用ping命令测试某台计算机的网卡,假设该计算机的IP地址为192.1.1.1,则命令如下:
---- #ping 192.1.1.1
---- 再用netstat命令来检查其收发包的情况,命令如下:
---- #netstat -i
---- 其中参数i表示显示活动接口,用于检查输入和输出数据包错误。如果从接口输入的包Ipkts增大,但从接口输出的包Opkts为0,那么是I/O地址错误; 如果Opkts增大,但Ipkts为0,则为IRQ错误。

---- 2.网卡在重启时正常检测,但不能同其他计算机互连
---- 这主要是由于网络掩码或广播地址配置错误、网线不通、网络协议不对、路由不正确、网络速度不匹配、网络程序包文件不完整等几种情况。首先ping网卡的IP地址,若通,则说明本机TCP/IP工作正常;若不通,则需重新配置网卡。如果还不行,可用检查、改正、分析文件权限和属主的命令fixperm来检查网络程序包的完整性。具体命令格式如下:
---- #fixperm -d 64

---- 参数d 64表示重置数据包为64字节。重新配置后需要删除/etc/hosts中多余的记录。还需要用ifconfig命令检查其他正常工作的计算机,应确保其网络掩码及广播地址一致。命令格式如下:
---- #ifconfig -a

---- 其中a表示显示所有网络配置信息。命令结果显示如下:
---- net0:flags=4043< UP,BROADCAST,RUNNING,MULTICAST >mtu1500
---- inet146.151.1.50 netmask ffffff00 broadcast 146.151.1.255
---- perf.params:recv size:24576;send size:24576;full-size frames:1
---- ether 00:80:5f:70:b2:f5
---- lo0:flags=4049< UP, LOOPBACK, RUNNING, MULTICAST >mtu 8232
---- inet 127.0.0.1 netmask ff000000
---- perf.params:recv size:57344;send size:57344;full-size frames:1

---- 第1行显示了本机的网卡(假设为net0)和本地回环的状态,其中网卡net0的flags值为4043,网卡已启用广播和多播,进行网络传输时每个数据包为1500字节;第2行表示IP地址146.151.1.50,子网掩码为255.255.255.0,广播地址为146.151.1.255;第3行表示传输参数,其中接受为24576字节,发送为24576字节,字节溢出标志为1;第4行表示网卡的Mac地址为00:80:5f:70:b2:f5;第5行显示本地回环的状态,其中flags值为4049,已启用,为本地回环,正在运行,多广播; 第5行表示网络传输时每个数据包为8232字节,IP地址为127.0.0.1,子网掩码为255.0.0.0; 第6行显示传输参数: 接受为57344字节,发送为57344字节,字节溢出标志为1。

---- 如果网络掩码及广播地址与其他计算机一样,那么可以用“arp-a”命令发现其他机器的物理地址。若不能发现则可能因为是网线不通或网络掩码及广播地址配置不对。例如,使用ping命令进行测试。假设另一台计算机的IP地址为146.151.1.100,命令如下:
---- #ping 146.151.1.100

---- 命令执行结果如下:
---- Pinging 146.151.1.100 with 32 bytes of data:
---- Reply form 146.151.1.100:bytes=32 time=5ms TTL=255
---- Reply form 146.151.1.100:bytes=32 time=5ms TTL=255.......

---- 表示到146.151.1.100这台计算机是通的,传输32个字节的包需要5ms。然后再用“netstat-i”命令检查Ipkts和Opkts在ping前后的变化情况,如果二者均没有增加,则说明网卡没有传输数据包,需要更换可靠网线。

---- 有些网卡缺省设置其速率为100Mbps,也会导致网络不通,需要根据所连集线器或交换机端口的速率,在其高级设置里设置速率为10Mbps或100Mbps,或10/100Mbps自适应。

二、线路的连接

---- 在线路连接方面,常见的故障包括线路短路、接地问题和线序等。

---- 1.线路短路
---- 在实际工作中,经常会遇到局域网通讯不畅的问题,其具体表现为下面的情况:在局域网中的某一结点ping其他主机时,虽然只是很小的数据包,比如只有24字节,却需要用几百甚至几千ms的时间传输,这样传输一个较大的文件就会非常慢。在这种情况下,首先查看集线器或交换机的状态指示灯,如果col灯一直闪烁或常亮黄灯,表示数据包在网络上有堵塞情况,需要检查同一局域网中是否有重复的IP地址,或局域网IP地址的划分有重复,方法是选一对可以通讯正常的计算机,让它们一直保持在ping通的状态,然后逐一插拔集线器上的网线,检查问题出在哪一根网线上。往往就是因为某一根网线的短路造成网络传输数据的混乱,从而造成网络堵塞。

---- 2.可靠接地
---- 如果所有网线和主机都没有问题,那么可使用万用电表测量一下网络设备的地线和零线之间的电压,如果电压超过3V,则表明集线器的接地有问题,静电不能及时释放,干扰了数据信号。在局域网中,数据信号是以矩形波的形式传播的,矩形波的传输特点是衰减快、容易受干扰。如果网络设备的供电系统根本就没有可靠地接地线,相当于直接使用两相电源而无地线,那么集线器的静电只能依靠空气来传导。众所周知,空气几乎是不导电的,因此静电无从散发,经过一段时间后,会在集线器上积累很多静电,用手接触集线器都会有明显的感觉。所以网络设备除了电源接地之外,机壳也要可靠接地。

---- 3.线序问题
---- 目前,计算机局域网大都采用五类线或超五类铜质双绞线,其连接的线序也非常重要。对8根4对的双绞线,比较容易出现问题,如果连接得不正确,会影响通讯效果。在10base-T标准中,第1、第2根线为一对双绞线,颜色为白桔、桔,第3、第6根线是一对双绞线,颜色为白绿、绿。在一对双绞线的传输中,由于网线是按照标准双绞的,会将电磁涡流相互抵消,延缓数据信号的衰减。但是如果使用不当,就起不到抵消涡流的作用,使传输距离和传输速度都打了折扣。笔者建议的线序见表1。如果一根网线的两端为同样的线序,则表明它是连接交换机或集线器的直联线。如果网线的一端为上述线序,另一端为1、3,2、6反接,见表2,则为双机直联线,又称为集线器级联线,可以直接连接2台计算机,也可以通过普通口直接级联交换机。

---- 此外,集线器的带宽是每个端口平均分配的。以100Mbps的8端口的集线器为例,在满负荷工作时,每一个端口的实际传输速率仅为100Mbps÷8=12.5Mbps,而且级联不能超过5次。交换机的工作方式和集线器不同,每个端口的带宽是固定的,说明书标明的10Mbps或100Mbps速率就是每个端口的实际速率。使用交换机还有一个好处,就是在需要时,可以通过VLAN技术将交换机的口划分成若干子网,子网之间不能相互通讯,有利于网络控制,提高网络安全性。由于目前集线器和交换机的价格相差不大,所以笔者建议,在一般情况下,最好使用局域网交换机而不使用集线器。

三、广域网检测和故障排除

---- 几个局域网通过路由器联接成一个企业内部广域网后,如果出现某台主机只能和另一局域网的部分机器通信的情况。这主要是由于不正常的路由、错误的子网划分或对方机器上设有相应的路由、网关或双方的帧类型不同等原因所引起的。可以通过以下方法来解决。

---- 1.按照数据包的路由逐个检查主机
---- 用Traceroute命令检测目的主机的IP地址,来找到数据包可到达的机器A,问题往往出现在和机器A相连的某个主机上,检查该主机上有无返回的路由或设置网关是否正确。这样一步一步排除故障,直至到达目的主机。

---- 2.注意应用
---- 确保子网间的路由正确,还要确保同一局域网上机器使用同样的帧类型,例如EthernetⅡ、802.3和802.5等。如果出现网络间歇性地不通、速率减慢或死锁等现象,主要是由于一些工作量大的应用程序,超出系统的负荷所造成的。这时需要调整Unix的内核参数,将参数调至最优。有时会出现类似“Out Of Streams”等错误提示。这时,可以用“Netstat -rn”命令来查看系统运行此程序所需的Streams,然后进行调整。

---- 有时人为的错误也会造成网络间歇性的不通,笔者在实际工作中就遇到一例。具体情况是: 广域网中的所有主机都是每隔5分钟中断一次到中心服务器的连接,10分钟后自动复通。开始检查了路由器、DDN线路、交换机和网络配置等,但是一切正常。在使用“Netstat-rn”命令动态检测中心服务器的路由表和路由返回时,发现其路由表会莫名其妙地丢失,然后又会自动出现。经HP厂家检查,中心服务器的核心配置、网络配置以及硬件都没有问题。于是怀疑问题可能还是出在路由器身上,很可能在某一时刻路由器不能提供正确的路由表。既然路由器没有问题,那么可能有另外一个与此路由器有相同身份标识的主机,而在使用TCP/IP技术组成的网络中,IP地址是主机的惟一标识。所以表明一定存在有另外一台主机的IP地址和作为中心局域网网关的路由器地址重复。基于这一推断,将路由器的网线拔掉,然后Ping它的IP地址,果然是通的。经过逐步排查,找到了误设IP地址的计算机,修改其IP地址后,网络恢复正常。

阅读(1026) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~