全部博文(1015)
分类:
2011-05-19 13:21:29
网络割接是对正在使用的线路、设备进行操作,将会直接影响到上面承载的业务,网络改造中最关键的一步就是网络割接。
网络割接又叫网络迁移,是指运行网络物理或者逻辑上的更改。网络改造中最关键的一步就是网络割接。
通常,业务运行网络要求24小时不间断,而割接一般都是对正在使用的线路、设备进行操作,所以网络割接将会直接影响到上面承载的业务,这种割接一不小心就会造成业务应用的中断。如何制定最完善的割接方案、如何执行最完美的割接、如何规避割接中的风险、如何减少乃至消除对业务系统的影响,这些都是我们在割接前需要详细考虑的事情。
前期的准备工作一旦做得不好,割接中可能会遇到很多意想不到的问题导致割接失败,甚至无法回退到割接前的状态。
制定详细的割接方案
许多网络割接不是一步就能完成的,通常会分为很多次小的割接,这时候就需要一个总体的割接方案和许多具体的割接方案一起组合来描述整个过程。
割接方案不但是描述割接中需要进行的各项任务,还包含各项任务的时间表,所以相关的内容是需要各个配合部门、单位共同讨论通过的。
对于割接中的具体割接步骤,不能仅仅是纸上谈兵,特别是牵涉到软件版本的改变这种协议上有较大更改的情况,通常需要搭设模拟环境进行模拟割接测试。任何软件都很难避免Bug(漏洞),网络起初的稳定运行不能说明在软件版本改变、协议逻辑改动后依然能稳定运行。例如美国的一个大运营商就曾发生过路由器软件版本大规模升级后几个小时后业务中断的情况。所以割接前的模拟测试是验证割接方案可行性的一个严谨的步骤,严格的测试有助于减少这方面的风险。
割接前期的准备工作包含通知相关部门和客户、确定联系人、准备割接材料、配置备份、信息采集备份等。
IT部门需按照规定好的割接方案的时间进度来进行割接前的各项工作:
● 通知、协调相关部门和人员——通知割接涉及到的单位、部门,需要有配合人员时,要确定具体配合的内容、时间等,协调业务受影响的部门该进行怎样的配合,通知相应厂商的技术支持人员在应急情况下的解决方案等。
● 板卡、辅料、工具的准备——准备割接使用的板卡、光纤、网线等; 对于有硬件操作的割接,除了准备好割接中需要的板卡外,还要按照实际操作的数量配备相应的备件: 备用的板卡、模块、光纤等。准备割接中会使用的工具,例如静电手镯、静电袋、Console线等。对于涉及需要架放线缆的割接,应该提前将需要的线缆放置好,并且测试无误。
● 设备的访问权限——需要提前取得设备的控制权限,如果有AAA(Authentication, Authorization and Accounting,认证、授权和审计)来进行认证管理的话,需要提前设置到本地管理员账号,以备在与AAA服务器不可达的情况下仍然可以获得足够的权限; 对于远程操作网络设备割接,需要确定好该设备本地Console(控制台)的访问方式,以备一旦出现故障或者误操作使该设备脱网的情况下,可以继续进行操作。
● 网络信息的采集——备份相关设备的配置文件; 通过网络管理工具或者文本形式记录所割接设备的状态以及流量,最好有一周的流量拓扑记录,这样才能在割接完毕后对比一周前同一时间的情况。
● 网络状态的确认——所指定的网络割接方案是在前期调研的前提下提出的,所以如果网络状态发生变化的话,可能割接方案就不再适用,所以你需要随时监测网路状态,有可能的话需要重新调整割接方案,重新进行模拟割接测试。
执行扎实的割接步骤
在割接方案中需要具体化每一个步骤的割接内容,计划应该包含每一个步骤的开始时间、结束时间、最晚回退时间、该步骤对每种业务的影响度等内容。实际操作过程中每一步骤应该包含3个小步骤:
● 每一步进行前的快照: 进行该步骤前几分钟,将操作设备的所有端口状态、流量、协议状态(多少个IGP邻居、多少条IGP路由、多少个BGP邻居、多少条BGP路由)记录下来; 备份设备的配置文件。
● 进行割接: 执行割接的命令或者物理操作。
● 检查是否成功: 通过show/ping/trace等命令查看,有条件时可以从客户端进行检查。
割接方案必须把这三个步骤具体执行的命令以及期待的结果明确下来。例如: 快照时需要执行哪几条命令,割接的时候需要执行哪些命令,检查的时候相应命令的结果应该是什么样的。
在有了周密的割接前的准备工作以后,割接工作就会很轻松,实施人员应按部就班地执行。需要注意的是每一个操作命令都应该被记录下来,最好使用CRT之类的专业Telnet软件来进行操作。
另外还有几项关键工作:
回退步骤——当发现该步骤不能完成时,或者中途出现异常故障且无法在预定的时间内恢复时,那么就应该进行回退了。
割接完成后的测试、观察——割接完成后还应该进行整体的测试,这个完整的测试包含的内容不仅仅是从设备层面进行,还应该有应用层面的测试,以及流量流向的观察。
在进行完所有的割接步骤和测试步骤后,进入观察期,一般情况下,24小内如果正常的话,该次割接就已经成功完成了。
割接方案小贴士
1. 画出网络拓扑图、设备连接图等,为割接方案的确定做好准备。
2. 画出割接后的网络拓扑、设备连接图等,以备割接时的参照。
3. 写出详细的割接步骤、实施步骤、系统的更改和配置步骤以及每步的回退方案等; 将割接的先后工序及所用时间排列清楚; 将各工序的负责人及施工人员安排列出; 讲明各工序操作的要点及注意事项; 准备使用的机具、仪表、材料清单。
4. 割接负责人的确定: 确定系统割接方负责人、厂家负责人、施工方负责人,如果割接项目较大,还要写出明确的人员分工。
5. 割接时间确定: 向上级主管部门申请割接停电路的时间,申请的时间应有充足的余量; 对通信网有较大影响的,应另调度其他电路作为过渡使用。
6. 割接异常情况处理: 做好相应的应急预案和准备相应的备品备件。
7. 割接方案报建设单位主管部门审批后方可实施,主管部门最好能组织相关部门的人员对割接方案进行严格的会审。(马凡平)
作者介绍
罗华 参与过国家交换中心、163骨干网、网通骨干网、电信、联通、移动、铁通等大小上百次网络割接,具有丰富的项目实施经验。2000年和2001年分别获得CCIE(Cisco认证互联网专家)和JNCIE(Juniper认证互联网专家)。
割接当天快照
1. 割接当天要开割接会议,割接时确保厂家督导、施工人员、随工、业务等相关人员及时到位,并再次明确各自的责任和工作任务。
2. 割接开始方案中确定的应急备件一定要运抵现场,以便出现问题时能够及时更换。
3. 割接过程中要严格按照割接步骤执行,未得到上一步的确认不能进行下一步的工作,参加割接的工作人员要认真对待工作每一个细节,加强相互间的协作,保证割接顺利完成。
4. 旧设备拆除: 当接到割接的指令后,应按要求关机。拆除旧设备时不得影响正在使用设备的正常运行。先拆除交、直流电源线并将其端头做绝缘处理,再拆除其他线缆; 拆除信号线、控制线时要注意防止短路; 对以后需要继续使用的线缆要进行编号留存,防止混乱。最后拆除旧设备。拆除的线缆、旧设备等应存放于安全、干燥的地方,列出清单存档。
5. 安装割接新设备入网: 对新设备的安装应准确、细致、有序、快捷。加电前应判明电源极性,并确保电压符合设备要求。单机测试主要指标应符合设备要求,搬迁的旧设备单机指标应能达到原水平; 对新设备、新电路或旧设备新电路的通道指标要求由设计人员重新设计认定。
6. 所有需要割接的光缆、电缆、设备一定要贴上对应的标签,尽量减少错漏现象,据统计很大一部分的割接错误都是因为物理连接出了差错。
7. 割接要严格按照制订的方案执行,如果有大的出入应停止割接,重新制定割接方案,以防出现重大事故; 如果割接不成功,应恢复到割接前的状态或其他预备方案。
总之,系统割接应避开业务高峰时段,选择系统负荷较轻时进行,建议一般的系统在凌晨0点到4点进行割接,要尽可能地缩短割接时间。割接完成后,在设备观察期间, 企业应安排相关专业且有处理问题能力的人员24小时内电话职守。一旦发生问题,应马上着手解决,并在第一时间通知割接工作主要负责人及相关人员。