Chinaunix首页 | 论坛 | 博客
  • 博客访问: 233930
  • 博文数量: 34
  • 博客积分: 1131
  • 博客等级: 准尉
  • 技术积分: 320
  • 用 户 组: 普通用户
  • 注册时间: 2011-12-09 12:16
个人简介

文章分类
文章存档

2012年(22)

2011年(12)

分类: 系统运维

2012-06-10 15:53:44

首先要有一个明确的策略。当局域网发生故障时,首先应重视故障重现并尽可能全面地收集故障信息,然后对故障现象进行分析,根据分析结果定位故障范围并对故障进行隔离,之后根据具体情况排除故障。
1.重现故障
当网络出现故障后,如果可能,第一步应该是重现故障,这是获取故障信息的最好办法。
在重现故障的过程中回答下列问题将有助于收集故障信息:
l 每次操作都能使故障重现吗?
l 在多次操作中故障是偶然重现吗?
l 故障是在特定的操作环境下才重现吗?
重现故障时,应严格按照发现问题用户的操作步骤进行,也可请用户亲自演示,这是因为计算机功能可以用不同的方式实现。
2.分析故障现象
收集了足够的故障信息后,就可以开始从以下几个方面对故障进行分析。
(1)检查物理连接
(2)检查逻辑连接
(3)参考网络最近的变化
3.定位故障范围
要限定故障的范围是否仅在特定的计算机、某一地区的机构或某一时间段。
回答下面的问题有助于定位故障范围:
l 有多少用户或工作组受到了影响?是一个用户或工作站、一个工作组、一个部门、一个组织地域还是整个组织?
l 什么时候出现的故障?
l 网络、服务器或工作站曾经正常工作过吗?
l 故障是在很长一段时间中有规律地出现吗?
l 故障是仅在一天、一周、一月中的特定时刻出现吗?
4.隔离故障
定位故障范围以后,还有一项非常重要的工作,就是隔离故障。这主要有以下三种情况:
① 如果故障影响到整个网段,则应该通过减少可能的故障来源隔离故障。除两个结点外断开所有其他结点,如果这两个结点能正常通信,再增加其他结点。如这两个结点不能通信,就要对物理层的有关部分,如电缆的接头、电缆本身或与它们相连的集线器和网卡等进行检查。
② 如果故障能被隔离至一个结点,可以更换网卡,使用好的网卡驱动程序(不能使用该结点现有的网络软件或配置文件),或是用一条新的电缆与网络相连。如果网络的连接没有问题,则检查是否只是某一个应用有问题,使用相同的驱动器或文件系统运行其他的应用程序。
③ 如果只是一个用户出现使用问题,检查设计该结点的网络安全系统。检查是否对网络的安全系统进行了改变以至影响该用户。是否删除了与该用户安全等级相同的其他用户?该用户是否被网络中的一个安全组所删除?是否某项应用被移到网络中的其他部分?是否改变了系统的注册方法或是改变了该用户的注册方法?比较该用户与其他执行相同任务的用户。
5.排除故障
一旦确定了故障源,识别故障类型就比较容易了。
对于硬件故障来说,最方便的措施就是简单的更换,对损坏部分的维修可以推迟。故障排除的目的就是尽可能迅速地恢复网络的所有功能。
对于软件故障来说,解决办法是重新安装有问题的软件,删除可能有问题的文件并且确保拥有全部所需的文件。如果问题是单一用户的问题,通常最简单的方法是整个删除该用户,然后从头开始或重复步骤,使该用户重新获得原来有问题的应用。
在故障排除以后还应请操作人员测试一下故障是否依然存在,这样可以确保是否整个故障都已排除。
阅读(2550) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~