分类:
2008-09-09 12:50:19
计算机网络与独立的计算机系统是不同的,特别是在大型计算机网络中一旦服务发生故障时,往往不能轻易、具体地确定故障所在的准确位置以及故障的性质和原因,而需要协调技术力量,调配网络资源,获取关键技术文档等各方面的支持。因此,需要有一个故障管理系统,科学地管理网络发生的所有故障,并记录每个故障的产生及相关信息,提供技术资料、应对策略和恢复方案,减少故障产生的影响,最后实现故障恢复。然而在大型网络主干发生故障时往往导致网管系统失效,网络故障诊断和恢复常常是依靠网络管理员的技术和经验实现的。
主干网络应包括网关器、主干机和与其相关的通信线路,主干网络的中断会直接影响到整个网络的正常运行,是网络中最为重要的故障管理。主干网络的管理员可以通过网管系统了解整个网络的运行情况,但是在处理网络故障时必须具备独立干预整个网络的能力。本文记录了某城市宽带网(ISP)发生的一次事故诊断和恢复的全过程,供从事网络管理的同行参考。
网络环境
某中心城市一家中等规模的ISP,约3000台联网主机,网络结构如图所示 :
1、网关路由器 cisco7000 200.200.200.1
2、外部主干机 catalyst 6000 200.200.200.2
3、 ciscoPIX520 200.200.200.3
4、网管 ciscoworks2000 200.200.200.10
5、网管宿主交换机 catalyst3524 200.200.200.11
(IP地址假设)(见图一)
[1]