分类: 系统运维
2008-03-25 17:10:58
[前言]
一个复杂问题的背后,往往是一个简单的答案
[正传]
话说某日,七哥在客户处口若悬河滔滔不绝的鼓噪。这时客户甲(类似路人甲这种角色),进来了,见到俺面露喜色,俺心知不好,肯定有麻烦。果不其然,
客户甲抓住俺的手曰:救星!
俺一把推开,“男男授受不亲!请保持一定安全距离,有话慢慢说“。。。
客户甲于是唠叨起其某个交换机的奇怪问题。就是这个交换机上某个VLAN只能访问这个交换机上连的同VLAN的用户。换另外一个VLAN就没有问题。他们怀疑交换机问题。
基本事实弄清,本着治病救人的方针政策,俺开始帮助客户现场TroubleShooting.
TroubleShooting第一要义,完整清晰了解整个事件,包括发生时间,地点,人物。以及是否有相关其他事件发生。客户的网络结构比较简单,一台H3 2403H交换机(L2)连接核心的Cisco Cat4003交换机(一种老古董)两者之间通过一根双绞线Trunk链路互联,网络中有两个主要VLAN ,一个作为办公OA,一个作为业务应用。在这次事件中业务VLAN没有问题,出问题的是OA VLAN。
收集完基本信息,开始根据个人经验判断问题基本上确定问题有可能和2403H与4003之间的Trunk链路有关。
在2403H上检查上联链路状态,Trunk已经起来,两个VLAN都是允许的,可能原因1排出。
再检查4003这端发现与2403H相连的这端Native VLAN设置成办公VLAN的ID了
改成一致问题得到解决。
[总结]
其实是一个很简单的问题,客户由于对Trunk链路802。1Q的理解不够深刻。故发生了这种事情。
在本例中由于两端Native VLAN不一致导致部分VLAN无法通讯的故障发生。
因为一端对Native VLAN的Traffic不进行封装加Tag,这样到了另外一端就会误认为是另外一个VLAN的Traffic而导致问题的发生。