Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1995312
  • 博文数量: 1647
  • 博客积分: 80000
  • 博客等级: 元帅
  • 技术积分: 9980
  • 用 户 组: 普通用户
  • 注册时间: 2008-10-13 15:15
文章分类

全部博文(1647)

文章存档

2011年(1)

2008年(1646)

我的朋友

分类:

2008-10-28 18:11:43


  故障现象
    第一次网络测试是在网络没有出现故障时进行的,结果显示各项测试指标都显示网络工作完全正常。将F683网络测试仪接大计费网络的器:监测网络的工作状况,显示路由器和用率为1%(相当于E1链路中有20Kbps左右的业务流量)、错误统计为0%,与网管系统观察的数据完全一致:将F683网乡里测试仪改为与计费并联的方式监测,测试结果相同,这表明此时网络工作很正常。在与计费网络所在地的局域网使用和维护人员交谈中了解到,网络工作人员从来没有感觉到他们的LAN有异常情况,虽然他们也知道手机用户在经常抱怨,但从计费LAN处检查不出什么实质问题、计费表现也正常。
  
  诊断过程
    故障出现时从网管系统上观察,路由器、机、计费服务器都没有问题。用OneTouch网络助理(即网络故障一点通)仿真用户流量对银行的路由器、银行网业务转接服务器(以上测试在银行进行)、移动通信公司的计费网络与银行网络的连接路由器、网络通道上的交换机、计费服务器等进行2分钟80%持续流量冲击测试(上述测试在计费中心),用F683网络测试仪监测移动监测各关键设备,结果基本相同,利用率均为80%,无错误出现除了计费服务器处的碰撞率2%外,其它各处均为0%.ICMP Ping测试均在3ms以内,ICMP监测测试无拥塞、数据不可达、重定向。数据参数错误等显示,这说明,网络的通道测试结果是比较好的。
    在这种情况下,一般可以采用两种测试方法继续检查故障:一种是被动监测法,即将网络测试仪、流量分析仪、网管等监测设备启动,对网络实施不间断监测,等待问题的重新出现;另一种是主动测试法,即将所有涉及到的和终端设备及其业务均启动或进行人为地仿真模拟,然后监测网络的工作状态,进行故障定位。为了尽快定位故障,与网络管理人员商定,我们决定采用第二种方法进行监测和测试,即将所有有关的网络终端设备启动,并安排人员进行业务流程模拟操作。
    第二次测试在当天业务结末后进行,在启动所有网络设备5分钟后,预期的故障现象果然出视,从网管系统上观察,网络连接路由器流量上升为3%,交换机流量增加1倍,计费服务器流量减少70%,网络没有发现异常情况。用F683网络测试仪对整个计费通道的有关链路和设备进行移动监测,结果显示;路由器和交换机的数据与网管系统的观察结果一致,而计费服务器的流量为68%:正常数据7%:错误数据61%(幻象干忧Ghosts、FCS错误碎帧等)。很显然,计费服务器与交换机之间的这条链路很可能有问题。
    从服务器网卡上拔下电缆插法进行电缆测试,结果显示只有1-2和3-6两对电缆,4-5和7-8线对没有连接。网管人员解释,升级后除了新增加的布线外,电缆系统多数没有变动,只有少数链路进行了调整。进一步检查发现4-5和7-8线对连接到了另一台备份服务器上,该服务器用于每周两次人工对备种关键数据进行审查、备份并上报局有关单位。恢复业务,启动备份服务器进行数据备份和传输,结果故障现象出现。
    将备份服务器临时用一条新链路单独连接,故障彻底消失。对换下的电缆进行测试:远端串扰NEXT不合格(起差-2dB,综合近端串扰PSNEXT-8dB)
  
  排除心得
    网络电缆内含4对(8根)细缆线,一般的10Base-T和100Base-Tx网络只使用其中的1-2和3-6线对,4-5和7-8线对不用,在10Base-T网络中曾流行将4-5或7-8线对用来传输电话,或者用4-5和7-8线对用来连接另一台电脑,在100Base-Tx以太网中由于网络工作频率和数据率很高串扰量很大,故这类用法是不被允许的。计费网络升级前有部分站点用一条电缆连接两台计算机,升级后这部分电缆没有变动:由于离新增加的交换机比较近,故将备份服务器接入了并用电缆。备份服务器平时虽然基本不用,但连接脉冲仍然会对计费服务器造成干忧,只是干扰量很少而已,这就是我们在交换机链路中观察到2%碰撞率记录的产生原因。由于该电缆的综合近端串扰PSNEXT不合格,数据备份服务器在工作时对计费服务器会产生很大干扰,破坏传输数据,使得同了个数据包不得不多次重传和多次重新处理,真实流量急剧上升到68%,重处理流量由0%上升到6.98%。由于服务器使用的是价格便宜的工作组交换机,所以网管系统无法从交换机端口发现链路中存在的严重问题。
    升级前业务偶然有中断的现象,这也是由于并用线缆串扰造成的,由于当时是10Base-T网络,速度低,所以这种影响比较小,往往只是偶尔且是瞬间的影响。
    在10Base-T以太网中存在着大量的非标准化布线以及大量不合格的布线链路,由于10Base-T网络工作速度低,这些严重质量问题往往被掩盖起来。直到升级到10OBase-Tx以太网后,这些问题才会明显地暴露出来。10Base-下网络布线系统中表现不明显的问题同时也给集成商、工程商和广大用户造成一种错觉,认为布线系统只要是物理上联通的就不会有问题,从而忽视了影响链路质量的布线产品品质问题、施工工艺问题对网络造成的严重影响。
    建议网络设计者首先采用标准化的设计方案,且只有工程商和用户在签订建造网络的合同时选用标准化的施工工艺和标准化的现场认证测试方案,才能初步保证综合布线系统的质量。
    一般建议每年(必要时每半年)对布线系统轮测一遍,以保证布线系统的性能合格,排除因布局父动,用户数量增删和人为调整等原因对布线系统造成的损害。另外,网络的业务工作和故障情况要有比较准确完整的记录,这样才能有助于故障的查找"如果 "病人"对自己网络的业务流程比较熟悉,则可以避免动用众多人员加班配合排除故障。
【责编:admin】

--------------------next---------------------

阅读(284) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~