2008年(8065)
分类: 服务器与存储
2008-06-01 10:26:03
在1998年,CommVault完全放弃其前代产品,希望重新开发更适应市场需要的统一数据管理平台之时,面临艰难的选择。在Hammer看来,当年的选择从某种意义上与重新创业并无不同,但又不完全相同。相同的都是从头开始,虽然有了准确的目标,但这个目标在当时市场来说是前所未有的,能否成功以及用户是否认可都未曾知晓。不同的时,因为有着之前的基础,加上Hammer准备充足的资金,有足够的时间去从头开始。自1998年至2004年间,公司始终处于亏损状态。但2005年开始已经收支平衡,并看到赢利的希望。通过其为上市而提交的S-1申请表格可以看出,截至2005年3月31日的上一财年CommVault净利润48万美元。从2005年4月1日至12月31日这九个月,CommVault净赚900万美元,总收入8100万美元,2004年同期收入为5900万美元。而截至今年3月的财年中,CommVault总收入1.095亿美元,净利润510万美元。
这些数字不仅仅证明CommVault的目标正确,也表明统一的数据管理平台是用户迫切需要的。ESG在2005年对目前的备份和恢复方案进行了调查和分析,问题最多的前5项表明都与时间有关,66%的人认为“备份时间太长”,49%的人认为恢复时间太长。这么多的数据,来自哪里?非结构化数据(未存储在数据库中的大量文件和电子邮件)是这种增长的最主要因素,占组织在线存储数据量的70%到80% 。此类数据的增多是大量书面存档的日常转换。同时,数据文件的有意副本也加剧了数据量的增长。重要数据例行复制到多个位置以防止所有类型的灾难。例如,在数据挖掘领域,通常为了运行商务智能查询而复制巨大的数据库。应用程序开发和测试过程中也会有意地创建大型数据库的大量临时副本。在全球,重要数据例行复制到多个位置以防止所有类型的损失。
CommVault统一的数据管理体系则将界面与底层架构统一,以一个统一的平台实现多种数据管理操作,从而节省用户的总体成本开销。由于共享底层的架构,很多源代码各功能模块都可以共享(比如数据的传输,对于备份、归档、快照、迁移等操作都要用到),所以可以大大节省开发资源,避免不必要的重复劳动,只要在相关功能方面开发新的代码即可,在保证统一性的同时,加快了新功能模块的开发进度。“统一、整合”这可以说是CommVault产品体系的核心架构,不同的数据管理模块构建于一个公用技术引擎(CTE,Common Technology Engine)之上,它们之间通过数据可分类与内容可搜索机制((Data Classification and Content Search Enabler)相联,并统一受控于智能操作平台(Intelligent Operations Management),而所能提供的功能模块包括了备份/恢复、快速恢复、持续数据复制(保护)、数据迁移、数据归档、存储资源管理等。
在谈到CommVault所独有的索引文件技术时,其产品管理总监梅立宏举了实际的例子,某个人将一个文件发送给15位同事时产生的副本数:收件人将文件保存到个人系统之后,可能还复制一次文件作为备份,按规定第二次复制,第三次复制用于灾难恢复。这样,将单个文件发送给15个人可能产生60个文件副本:15个有意副本和另外45个无意副本。个人在共享文件时无意中创建数不尽的数据文件副本,使问题更加复杂。
而让CommVault骄傲的地方恰恰在此,文件备份时会建立两套索引,一个是一级备份数据的索引,记录了备份数据的关键信息;另一个是二级备份索引,记录着索引的信息。一级索引分布在各备份服务器上,使用C-TRIEVE数据库进行检索,二级索引则相当于一级索引的索引,使用微软SQL数据库进行检索。这其中,二级索引的数据将一直累加,而一级索引相当于一个索引的缓存(Cache),为了保证索引的效率,其内建的索引条目将被限制在一定数量,当超过这一数量,将把最不常用的索引信息删除,日后若需要寻找相关的数据,可从二级索引库中进行查询。
采用分布式关系式结构而非传统的目录式索引结构,可大大提高检索的效率,而且它还将数据的索引与数据一起保存到备份介质中(比如磁带、光盘等),也就是说,即使一级索引与二级索引都被破坏了,用户还可以从备份介质中找到索引信息,虽然恢复的速度要比一、二级索引还在时慢,但这种设计使得数据可恢复性大提高。而且由于这种机制使得索引的精细度可以大大提高,从而可以细化恢复的颗粒度,使精确而快速的定点恢复数据成为了可能。
CommVault采用两级索引模式,是因为CommVault相信,一切的数据备份、保护操作都是为了在需要使用数据的时候,能够快速恢复。而在恢复管理中,有效的索引无疑是一大利器。CommVault的分布式索引方案,使快速检索和快速恢复成为可能。
CommVault数据管理的不同之处在于,其不仅仅是对存储设备固有功能的调用,而是创建了一个统一的服务平台来建立和调用CommVault的功能。CommVault提供了一个具有集成能力的通用技术引擎CTE来跨越三个层面的数据管理:恢复管理、数据保护和归档管理。这种独特的能力具有节省费用、使用方便的优势。CommVault的QiNetix是包含所有上述功能的统一软件产品,是统一的源代码,在一个GUI用户界面下就能管理数据恢复、保护和归档,具有统一的索引,只要一个策略就能完成数据在不同存储层之间的传输。