分类: 服务器与存储
2008-06-11 21:21:07
谣言五:磁带速度太慢了
硬盘可以用来给一些应用程序做快速备份和恢复,因为它可以提供随机文件访问。磁带则需要顺序访问到特定的位置。然而,也不是所有的数据都需要快速或者经常访问的。有些数据可能会存到次级硬盘上,并在那里寿终正寝,有些数据可能还会从次级硬盘移动到磁带上作为存档,还有一些数据甚至不会使用昂贵的硬盘空间就直接被存到磁带上了。
当数据被移动到磁带上,速度可以很快。最新推出的LTO Ultrium-4访问本级驱动器数据的速率可达到每秒120MB。也就是说每小时可以处理864GB的压缩数据。这比现在的硬盘备份速度可快多了。
但是磁带并不仅仅用于备份,下面我们再看看别的情况。
气象卫星将收集的信息传回到地球,这会生成大量需要存储的数据。美国国家大气研究中心每个月要生成超过60TB的数据,猜猜看这些数据存储在哪里?没错,就是磁带!没有任何一种介质能替代磁带成为如此大规模数据归档存储的载体。
老式的好莱坞电影是保存在胶片上的,很容易出现问题,保存时需要注意周围的环境以防止对胶片进一步的破坏。这些影视精品现在被数字化了,可以存储在磁带上,留给后辈们欣赏经典的银幕故事。如果今天所有的电影和广播都可以数字化,就会需要大概6ZB的存储空间,1ZB是多少呢?1ZB数据相当于1,024EB,1EB数据相当于1,024PB,而1PB相当于1,024TB!这可真不少啊!
电视台和一些影视制作单位要做的就是吸取、处理和播放大量从各种渠道获得的视频。他们将这些视频用一个特殊的文件系统嵌入到磁带中,这个文件系统可以让他们将每个视频的元数据也保存下来。
美国国家大气研究中心和 Turner Entertainment Networks并不认为磁带处理速度太慢,他们每天都在和磁带打交道,处理他们的数据。但是这也引出了第六个传闻,关于硬盘和磁带的价格比较。
谣言六:硬盘比磁带便宜?
硬盘的价格一直在下滑,这种价格下滑的趋势随着更高容量、较低性能的SATA硬盘的出现而愈加明显。现在有很多人认为硬盘要比磁带还便宜。他们把平均1GB的SATA硬盘的成本售价作为依据,但是这些数字是平均值,而平均值只能说明一小部分的问题,且不能包括所有的成本支出。
事实上,在比较硬盘和磁带存储相同数量的数据时,成本平均值没有什么意义。硬盘系统所需的成本可高可低。双控制器的就要比单控制器的贵,而高级功能,比如管理软件,则会进一步增加费用。
去年,笔者比较了两个系统的成本——1个LTO-3自动磁带库解决方案和一个SATA硬盘系统——它们可以储存相同的数据。假设一个数据中心需要存储150TB的数据,而且每年还以30%的速度递增。在第五年底,他们需要存储的数据量就会达到464TB。这就需要15个中型硬盘存储系统,共计需要花费1,686,705美元。而类似容量的LTO-3自动磁带库仅需要花费261,042美元。
当比较这两个系统的购置成本时,SATA硬盘大概比自动磁带库要贵6.5倍。再算上占地费用和能源消耗费用,LTO-3磁带库则比SATA硬盘系统要省钱大概11倍。
别让平均值带你误入歧途,认为硬盘要比磁带省钱。唯一精确的计算方法就是同样的容量下比较两种系统的支出情况。在大多数情况下,磁带仍然比硬盘便宜得多。而且在实际使用中,我们还需要进一步讨论所有的支出,包括能耗支出等等。
磁带是绿色的——不是绿豆蛙的绿色,而是说对环境无害。硬盘驱动器要不断旋转就需要电力支持,不管是否有人访问这个设备,以及随之而来的冷却降温保护。而磁带,在没有读写操作的时候则消耗很少的电力,磁带盒在一个自动磁带库中时根本就不需要任何电力供应。
在新英格兰地区,每千瓦时电费大约为14.5美分,前文所述的15个硬盘系统1年的电费大约为109,745美元,而自动磁带库1年的电费也就是4,238美元。硬盘系统比磁带库系统在能源上的消耗多了25倍。大部分数据中心都身处大都市中,这种能源消耗的支出需要持续关注。如果电费一涨再涨,那么把老版本的数据备份存储到磁带上应该可以帮助控制这方面的开支。
因此,电力与降温设备的支出不能被忽视。电费一定要作为购买成本中需要考虑的项目,在这方面,磁带要比硬盘节省25倍。
数据精简技术对容量成本的影响
今天,我们有重复数据删除、数据压缩等等不同的技术来缩减所需要的数据容量,而这些技术大多数都是基于硬盘存储系统,那么是否这些技术能有效降低磁盘存储的成本,使硬盘存储的成本看起来比磁带更低呢?
虚拟磁带库是基于硬盘的备份系统,仿效的是磁带驱动器和带库。这个系统是为了提高备份和恢复小文件的性能而开发出来的。如今,很多虚拟磁带库厂商在他们的系统中部署不同的数据精简技术来减少需要存储的备份数据的总量。前提条件很简单,只有一小部分数据每天都会发生变化,我们就不再一次次备份那些从来不改变的数据了。这样,我们节约了一大笔存储容量成本,我们最终需要多少空间来存储这些数据?答案取决于数据精简技术了。
有些数据精简执行会查明完全相同的文件,并只保存文件的一个拷贝,比如PowerPoint幻灯片或者Word文档。不过,改变PowerPoint幻灯片的第一页幻灯内容,软件就会认为是一个修改过的文件了,会完全保存这个幻灯片的全部内容。
还有一些数据精简的技术则粒度更小。它们可以检测文件中的片段,发现文件中和其它文件相同的片段。这种应用可以把上文提到的修改后的幻灯片的第一页作为新的数据保存下来。
数据精简是否改变了磁带和硬盘的成本关系?虽然比较自动磁带解决方案和SATA硬盘解决方案很容易,但要比较使用数据精简技术的虚拟磁带库和自动磁带库或者标准的硬盘系统的成本可就没那么简单了,这是为什么呢?
虚拟磁带库系统包括管理虚拟磁带机的智能软件。一般情况下,它们要比纯粹的SATA硬盘系统贵。有些虚拟磁带库带有数据精简软件,有些则没有。通常,虚拟磁带库的功能越多,它的价格也就越高。
数据精简执行随着要存储的数据类型和数量的改变而有所不同。要想达到最大的精简比率可能要花费数周的时间,记住数据精简是和存在的文件或片段进行比较,然后去掉冗余的部分。大部分企业发现这一工作会持续数周甚至数月时间才能达到最大的精简比率。
因此,比较使用数据精简技术的硬盘存储的成本与磁带存储的成本本身是件极为复杂的事情。我们是否使用足够的容量配置了数据精简的虚拟磁带库,这样就可以存储所有最初的备份文件?我们在没达到最大精简比率之前把那些不适合于虚拟磁带库的备份存放在何处?我们该使用多大的数据精简比率?20比1?达到这个比率会用多长时间?
有些使用数据精简技术的基于硬盘的备份工具在达到了最大数据精简比率的时候,它的成本接近于磁带,当然这是在购买了额外的存储空间,能满足最初购置时数据存储的需要之后。而且,磁带系统总是体积小还节能的,同时让你所有的重复删除的数据都在线也是数据保护的一种隐患。另外,磁带的可移动性还能应对灾备恢复的要求。
虚拟带库的确可以缩短备份和恢复的时间。很多企业实施了虚拟磁带库技术将一周内的数据备份存储在硬盘上,并把更早期的备份转移到磁带上,这样做既经济实惠,又能体现磁带可移用性的优点。数据精简让这些企业将增量备份储存在硬盘上,或者将更长时间的备份数据储存在硬盘上。
但是需要注意的是——一个虚拟磁带库坐落在主数据中心并不能提供灾备恢复的保护。如果没有磁带,这个备份方案是不完整的。磁带的存储是能够提供可移动的存档数据的,这也是对抗各种数据丢失的唯一形式。因此,物理磁带仍然作为最经济的方案给大家提供存储备份和灾难恢复的服务。