2008年(8065)
分类: 服务器与存储
2008-11-25 15:19:49
存储加速:有所为,有所不为
记得十多年前初学编程的时候曾经看过一句话,大意是:所有的计算机功能都可以用软件的方式实现,(与硬件的)主要区别在于效率和性能。绝对算不上严谨,但其中蕴含的道理还是值得回味的。
至少,从数据处理的角度来看,就是这个“效率和性能”,决定了“CPU加软件”的模式不会在每种情况下都能成为最佳选择。因此,由专用的硬件加速引擎将某些特定的运算任务从CPU“卸载”(offload)下来,有时可以收获更好的性能和费效比。
一个相对贴近我们日常应用的例子——VGA卡。稍微资深一些的用户都知道,十多年前的计算机中虽然也有显示卡,但其地位远没有现在来得重要,甚至发展出了复杂度堪与CPU相比的GPU(图像处理单元)。CPU是“通才”而非“专才”,如果没有独立的显示单元分担,3D和视频渲染工作将会让其不堪重负。
不过很容易也能举出视频播放的反例来。VCD和DVD发展的初期,由于CPU的能力不够强,都经历过独立的硬件解压卡配合播放的阶段,然后硬解压功能被显卡所集成,最终发展到CPU能够独自解决、不再依赖硬件加速的状态。目前正在兴起的高清视频,也多少还需要显卡提供硬件加速功能协助播放,但可以预见,随着CPU性能的不断提升,“高清硬解”作为显卡卖点的日子很快也要一去不复返了……
举了一正一反两个例子,无非是想说明,如果要通过硬件加速为CPU分忧,必须选择那种对性能的需求“水涨船高”、“快无止境”的应用。像视频播放这种在一段时期内对性能需求恒定(固定的分辨率和帧率,码流不会超过上限)的应用,很快就可以被性能快速攀升的CPU用软件搞定,不再需要实实在在的帮手,因此很难形成一个连续稳定的硬件加速市场。
数据资产……无处不在
如果您觉得企业级应用会有所不同的话,不妨再看一个iSCSI的例子(保证是最后一个)。2004年前后,iSCSI市场刚开始起步,当时很是有一些从事iSCSI HBA业务的厂商,提供TOE(TCP/IP卸载引擎)硬件加速。可是,卸载TCP/IP的任务对CPU的要求并不高,差不多1GHz的处理性能就可以满足1Gbps iSCSI的要求,这对于动辄就双核、四核,主频随随便便3GHz的服务器CPU来说,实在算不上多大的负担,谁还会花数百美元去买iSCSI HBA呢?因此,在以太网卡芯片都开始具备TOE能力的今天,只剩下屈指可数的几个幸存者,在苦苦等待10Gbps iSCSI上位……
所以,一定要找到那种CPU做起来“吃力不讨好”且对性能的需求“与时俱进”的任务来加速,才能够获得可持续发展。看起来,硬件加密和数据压缩是符合条件的两大领域,而Hifn公司十年来的发展历程也足以证明这一点。
数据加密:安全无处不在
作为一家10年前就已在纳斯达克IPO的公司,全球仅有165名员工、年营收不到5000万美元的Hifn规模确实是小了点。不过,对于一家主要向思科(Cisco)、华为、EMC、NetApp等大型OEM客户提供网络和存储加速卡的小厂商而言,Hifn的日子过得还算滋润,董事会主席兼CEO Albert E. Sisto就颇为他们的3400万美元现金储备而感到自豪。
特殊的业务模式决定了研发人员在Hifn所占比例过半(94名),而其中的三分之二(65名)位于中国——来自一年多前收购的杭州安赛科技。因此,不定期地来中国视察工作、拜访客户就成了Albert E. Sisto的重要工作之一,他的名片甚至还印上了“艾伯特 E. 西斯托”的中文名字。
Hifn将自己定义为持续数据保护和容量优化技术的领先提供商,这里的“持续数据保护”并非指狭义上的CDP,而应被理解为“持续的数据保护”,保护数据安全的成分很重,涉及的应用包括备份和加密;容量优化则是在确保无损的前提下缩减数据量,节省存储空间和传输带宽。对于存储厂商和用户而言,VTL(虚拟磁带库)、数据安全和数据压缩是Hifn主攻的领域。
数据安全挑战……无处不在
数据加密是近年来的热点,也是主机CPU力有不逮之处。有数据表明,软件加密会影响备份客户端的性能,下降幅度通常在30%到50%,这对于本来就深受速度之苦的备份过程来说,无异于雪上加霜。而专注于加密的硬件加速卡能够以线速压缩数据流,将主CPU从繁重的加解密任务中解放出来。
Hifn有用在交换机中对流经的动态数据加密的ASP(应用服务处理器)产品,不过存储领域目前更关心的是静态数据加密。Albert E. Sisto表示,名为“静态数据”,其实都有(随其载体——也就是存储介质)移动的可能:
以交换、转移数据为主要职责的光盘和磁带自不必说,近两年来存储行业已太多次因为丢失保存有重要数据的光盘或磁带而成为普罗大众的“关注焦点”了;
闪存盘和闪存卡的小巧是优点更是缺点,它们很容易被带出工作地点,丢失或被窃的可能性都很大;
至于不断增加的移动办公用户,他们的笔记本电脑或PDA等随身计算设备一旦遗忘在某处……
静态数据其实并不老实呆着
就算平时“端坐”在保护严密的数据中心里的磁盘阵列,也有搬家的可能。如果这个理由太过牵强的话,磁盘阵列里所用的磁盘总有因为各种原因被替换下来的时候,倘若上面的数据没能被彻底清除,仍然有被其他人获得的可能。因此,无论从哪个领域来说,数据加密的重要性都将与日俱增,这对Hifn来说意味着巨大的市场机会。
数据压缩:加速重复数据删除
相对于数据加密而言,Hifn公司更长于数据压缩。Hifn深以其拥有专利的LZS(Lempel-Ziv-Stac)算法为傲,这种由该公司首席科学家发明的压缩算法继承了LZ算法压缩率的诸多特性,同时兼备硬件逻辑实现简便和更高的压缩性能等良好品质。LZS算法还会自动检测数据是否已经压缩,充分避免对已经压缩的数据进行重复压缩操作而导致的数据膨胀——即对于图片、音频和视频等多媒体文件,以及部分已经压缩过的文件,消除重复压缩导致数据无谓膨胀的影响。目前LZS压缩算法已经广泛应用于网络和存储各个领域,并被ANSI、IETF等国际标准组织和技术联盟采纳为业界标准的一部分。
据称,作为工业标准的LZS算法已经在超过一亿套磁带上实现。随着虚拟磁带库(VTL)的兴起,Hifn(及以前的安赛)提供的VTL硬件压缩卡也受到了EMC、NetApp、Sun、昆腾(Quantum)和Sepaton等VTL提供商的欢迎,并催生了进一步的商业机会。
我们知道,目前能够实现数据缩减的技术主要有两种,除了通过对数据重新编码来降低冗余度的数据压缩,还有着眼于删除重复出现的数据块的重复数据删除(De-Dup)。相对于压缩比通常为2∶1~3∶1的硬件压缩而言,重复数据删除具有把数据缩减的比例提高一个数量级的潜力。
高效的无损压缩和零延迟无缝加密是Hifn在存储领域的看家法宝
在备份、归档等存储应用中,经常会有大量的重复数据块存在,既占用传输带宽又消耗了相当多的存储资源——有些新文件只是在原有文件上作了部分改动,还有某些文件存在着多份拷贝,如果对所有相同的数据块都只保留一份实例,实际存储的数据量将大大减少——这就是重复数据删除技术存在的理论基础。
根据实现方式的不同,重复数据删除技术分为in-line和post-processing两大流派。in-line可以近似理解为实时处理,在数据流入时就进行除重操作,优点是磁盘空间占用少,缺点是争用处理器资源;post-processing则是事后处理,即在数据写到磁盘上之后再除重,优点是性能相对较高,缺点是占用磁盘空间多。
不过,无论哪一种实现方式,目前都是通过软件的手段,需要大量消耗VTL或磁盘备份设备的处理器资源,对性能会有不利的影响。现在重复数据删除主要用于VTL和二级存储,以NetApp为代表的厂商正在努力让主存储也应用该技术,但是这会拖累主存储的性能表现,降低其所承载的应用的服务水平,而如果能够有专用的硬件加速卡来实施重复数据删除,则可以免除这一后顾之忧。
今年3月底,Hifn率先推出了采用硬件加速的重复数据删除卡——DR250/255。它们内置快速、强大的SHA-1或MD5 哈希算法(用于重复数据删除),同时支持平均压缩比率达2.5∶1的单通道LZS数据压缩,并带有一个可自主选择的加密引擎,是业内首个集硬件压缩、重复数据删除和加密于一身的加速卡,处理数据流量可达250MB/s,完全适合在IP SAN 和 NAS设备中运行。
不过,DR250/255还不能同时执行全部的三个功能——压缩和加密能够同时执行,散列(分割数据流以确定重复部分的过程)则必须单独处理。有消息说Hifn正计划在2008年第四季度发布新一代产品,届时这三项功能可同时执行,且处理速度高达1GB/s。