2011年(11)
分类: IT业界
2011-02-22 18:46:52
【网管员世界】对于现代大型企业来说,网络在公司的作用是至关重要的,因此选择合适的网络流量控制设备就成为了一个大难题了,今天我们通过齐鲁石油化工公司选购网络流量控制设备的过程,来给更多的企业提供一些参考案例。
齐鲁石油化工公司是中国石油化工集团公司直属的国家特大型石油化工企业。目前,齐鲁石化公司有直属单位20个,职工三万多人。作为其旗下的一个二级单位,我们网络中心搭建了用户接入量规模达18000多户的网络。然而,3个千兆接入仍然不能满足庞大用户群体的需要,每天客服中心都接到不同的投诉,大多数投诉主要集中在反应上网速度慢的问题。但暂时不能进行扩容的情况下,这个问题始终不能有效的解决,网管中心的同事为此头痛不已。
问题在哪里?理论上来说,18000户平时的并发量应该不至于引起网络的崩溃,因为一般上网的用户浏览网页、进行游戏,不会使用太多的带宽资源。而且我们的带宽根据设计单位的建议,是完全足够使用的。有的同事说这可能是P2P下载太多导致的,对于这种说法,大家也一直深信不疑。因此经过大家讨论和领导的许可,网络中心打算找几家相关的设备厂商来测试一下,一方面是找出导致网络堵塞的元凶,另一方面也是希望能找到一个合适的产品,把我们这个问题彻底解决。
测试过程 国内厂家——别拿吞吐量的指标“瞎忽悠”笔者在网上了解到,目前解决流量拥堵的手段基本是靠流量控制设备来进行带宽资源的管控和调节,这种厂家国内非常多,找一些圈内的朋友推荐,有些牌子还是比较有名气的,所以就联系了几个厂家来测试。
这次上线设备,网络中心对于设备的稳定性十分的重视,提出要求CPU、内存占用率不能太高。这主要是考虑系统负荷超载的情况,如果CPU、内存占用率居高不下,对于串行设备来说,长时间运行下来可能会发生故障,引起网络中断,造成通信事故。A设备厂商一直在给高校提供产品,考虑到高校的情况和我们比较类似,所以让他们先进行测试。结果上线后,算是顶住5Gbps全流量的压力,但是查看CPU占用率居然高达90%,这个指标不符合网络中心的要求,于是我们又找来了B厂家。B厂家的产品在业界很有名气,可是一上线就崩溃了,连一条千兆链路的压力都没有顶住。
3条千兆光纤接入,总流量一共3Gbps,双向6Gbps,在宣传资料上把自己说得很好的几个厂家都说自己没问题,至少可以达到3Gbps的吞吐量。可是上线后,有的居然单向1Gbps的流量的测试都通不过,到650Mbps就崩溃了。
这里跟各位运营商的网管同仁们提个醒,一般我们的网络都是满负荷运作的,用术语叫“千兆线速”,极限一般是单向980Mbps——即双向约2Gbps。有很多厂商都在这个地方故意模糊自己的指标,单口最多只能处理650Mbps,他们就做成三进三出,然后说自己能达到4Gbps的处理能力。可是这样的性能指标,只要一条链路的流量打满,他们设备基本就崩溃了。所以千万要注意单链路的处理能力,如果他们有4个口,那总吞吐量是4Gbps才对,如果是6个口,总吞吐量一定要是6Gbps,否则就会在网络满负荷时出问题。
国外厂家——性价比之低令人难以接受第一轮测试下来,国内的厂家都没通过,只有一家国外的C厂家品牌通过了测试。可是外国品牌不仅价格高,而且对常用的迅雷、QQ等“中国特色”的协议都不能支持的很好,再加上全英文的界面实在是太难用了。结果我们还是耐着性子继续在网上寻找了一番。
再次测试——出乎意料的结果朋友通过网络找到了G厂商,打包票说一定能满足我们的要求。同事们都将信将疑,于是给了厂家一个苛刻的要求,上线测试的3条链路接近满负载的同时,要求其设备的CPU占用率低于50%。都说无心插柳,大家本不抱太大期望的,但是没想到无意间在网上找到的厂家居然把我们的问题解决了,管控3条链路下来,流量最高跑到了5Gbps(其中两条链路达到线速),而一查CPU占用率,居然只有20%!
当然更值得一提的是过程,如果大家以后会接触流控这东西,可以考虑像我这样测试来看看设备对流量的控制能力如何:
1、流量是多少能一目了然这一点比较容易评价的,看看设备的图表就可以知道了。在流量图中,我们惊讶的发现,网络中的主要应用并不仅仅是P2P下载,还有很大一部分是P2P的在线视频流量。这是我们一直所疏忽的,而且是一个大疏忽。如果想要进行管控,那就要制定符合用户特点的控制方案。因为平时用户也经常上优酷一类的在线视频网站,对这些视频网站的访问可能不能全部封掉。那我们只有就针对P2P下载“开刀”了。
2、流量是否整齐第二步,我们对流量做了个“整形手术”。比如,我们设定的P2P下载策略中,有1Gbps下行流量,800Mbps上行流量。结果流量就变“老实了”,形成了一个很整齐平滑的图。厂家的技术人员提醒我们,一般来说,流量整形最好将实际流量控制在总带宽的80%,这样可以避免因为瞬发情况而导致有些应用被中断。因此我们调整了流量控制方案,结果控制效果非常好。
3、能否控制自如对网络流量控制自如,并且在图表上反映出来,这是很考验设备的功能和性能的真实水平的。因为这台设备可以做分时自动控制,我们要求该设备设置22:35、22:40、22:43时,将P2P下载的400Mbps流量分别改为500Mbps、600Mbps、700Mbps。结果从测试情况来看,流量成一个阶梯形上升,系统响应速度非常的快。如果能做到这一点,就说明设备在流量的控制方面有一个非常高的精度,在流控功能和性能上有一个很好的表现。
4、能否精确识别各种网络协议目前网络技术发展迅速,各种网络应用层出不穷。针对这种情况,网络网络流量控制设备除了能够精确识别目前网络中主流的网络协议外,还能够尽可能多对一些小应用的协议进行识别。同时具有快速更新协议库的功能,每种新协议的出现,网络流量控制设备厂家能及时跟踪并有针对性的更新协议库,方便客户更好的对本地流控系统进行策略的修改。
5、能够对各种流量进行分类显示网络流量控制设备能够对检测出的各种网络流量按照流量的大小及应用协议等条件进行灵活的显示,方便用户有针对性制定各种控制策略。同时未知流量不能大于20%,否则,无法对流量进行更好的控制,再进行流量控制就失去了意义。
结论本以为国内厂家做了这么多年,我们都快步入万兆时代了,应该有很多厂家可以满足6个G的要求。没想到在处理极限情况的时候,能真正达到其承诺指标的厂家居然只有一家。看来在提高性能,进行大流量处理方面,大多数国产厂家还要努力。G企业设备的居然能通过这个测试,是我们没有想到的。询问了一下他们的厂商背景我们才了解到,他们一直是给电信和联通供货的,由于这个公司致力于专业在解决电信、联通、各个中小型运营商以及高校的“疑难杂症”,虽然很少有人听说,但积累了不少大流量处理方面的经验。因此大家选择产品的时候,要根据自己的需求挑选相关背景的厂家。有的厂家名气很大,客户数量虽多,但大部分是中小型网络规模,在提供高端方案的时候就会有困难。
通过这次的了解,我们对网络流量控制设备有了比较深的认识,一般来讲这些设备在功能上都大同小异,但是表现方法各有不同。现在这方面的技术术语也比较混乱,所以要采购这类设备的时候千万注意别被忽悠了。要把握好也不难,一般只要关注以下几方面的问题就可以了:
1. 能不能给网内用户进行分组(根据IP或者用户名);
2. 能不能识别常用的网络协议并分组,还包括能不能及时进行协议库更新和自定义;
3. 还有就是前面提到过的,要分清楚总吞吐量和单链路线速转发能力是不同的,这个地方厂家可以设置陷阱;
4. 要注意图表功能和流量图以及日志功能,这些对于大家排查问题很有帮助的。
5. 注意性能是否达标的同时,要多看系统资源的使用情况,如果CPU占用率超过60%,那为了你的线路稳定,还是换一家吧;
不少厂家有一些其他的功能,一般都不是很核心的。当然如果各位有特殊的要求那就看具体情况,但是一般来说如果说自己功能多,那价格一定也要体现得更“多”,所以各位多留些心眼,不要在一些“忽悠人”的功能上花太多的精力,反而忽略自己网络实际情况真正的需求。
网络流量控制设备市场鱼龙混杂,当然不乏很多好产品,不过各位不要太迷信“名牌”,不光要在技术上严格把关,还要谨防销售的“忽悠”,这样才能避免日后的各种麻烦。自己用得好,才是真的好!
参考链接: