2008年(8065)
分类: 服务器与存储
2008-05-09 10:47:25
存储管理的7点提示
重要存储标准一瞥
说到存储,有一个标准获得了广泛采用,那就是存储网络行业协会(SNIA)的存储管理计划规范(Storage Management Initiative Specification,简称SMI-S)。随着越来越多的存储系统从直接连接转向连接到服务器和企业网,SMI-S的地位也越来越突出。SMI-S实现了分布式存储资源的集中式管理。
SMI-S目前具有发现存储区域网上的阵列、主机总线适配器、光纤架构和交换机的能力,行业观察家们预计,到今年末,用于网络附加存储的SMI-S规范将出台。除了SMI-S,IT经理们至少还应该知道以下3个标准。
[next]
新一代数据中心存储聚光灯--虚拟化简化管理
有了新型存储虚拟化产品,多厂商存储资源提供就变得更加容易了。存储虚拟化并不是一个新概念,但是由于最近顶级存储厂商推出了下一代虚拟化产品,因此这一概念重又引起了人们的注意。各厂商实现虚拟化的方法不完全相同,有的把虚拟功能放在网络中,有的则在边缘或者阵列中实现虚拟化。但是不管有多少种实现方法,虚拟化都是针对同一个基本问题而来:简化存储管理。
在传统的存储设置中,执行数据复制、磁盘镜像等关键存储功能所必需的智能一般放在主机或服务器一级。虚拟化就是,服务器把所有企业存储设备作为整体,将其看成一个大的存储池。因此,传统的虚拟化就是在每个服务器上添加软件、设备驱动程序等,这样的虚拟化极难管理。
2000年至2001年期间,人们开始尝试把存储虚拟化所需智能转移到网络设备上,出现了一些专用设备,如DataCore公司的SANsymphony和FalconStor公司的IPstor。用户可以用这些专用设备把所有存储设备集成为一个存储池,这样每个服务器就不再需要添加驱动程序或其他软件了。但是这种方法从未真正流行起来,主要原因是大型顶级存储厂商未参与到这一潮流中。丹麦歌本哈根金融公司SDC Udvikling的IT顾问Bo Christiansen说:“不久前我们安装SAN时曾考虑过FalconStor的IPstor。它可以把不同的存储技术集成到一个GUI之下,这是我们所希望的。但是在它的工作方式上存在一些问题,另外也有一个厂商锁定问题。”
IBM是第一个完全接受虚拟化的大公司,2003年7月推出了SAN Volume Controller(SVC),该产品可以作为网络专用设备,也可以作为刀片用到的MDS导向器级SAN交换机中。自去年8月增加了对日立数据系统、惠普和EMC阵列的管理功能以来,IBM的SVC取得了相当大的进展。今年3月,IBM宣布,其SVC客户已经达到了1000个。
日立公司推出了TagmaStore虚拟化阵列,Sun则推出了StorEdge 6290控制器/阵列系统。EMC的Invista虚拟化软件今年5月上市,可运行在、Brocade和McData的导向器级交换机上。
这些对用户来说都是好消息,因为他们正在为应付爆炸性增长的存储量以及为满足法规要求而大伤脑筋。美国加州地区性银行Pacific Capital Bancorp公司的高级IT副总裁Al Todd说:“存储量疯狂增长,估计现在一年要增长25%到30%。我们无法存储足够的客户数据。而且还有一个问题,怎样管理这些数据?”
Pacific Capital有23TB数据,散落在公司各处,主要存储在IBM和EMC的阵列中。Todd说:“过去,我们不知道自己有多大的存储容量,也不知道我们使用了多少容量,我们只是有了新数据就增加磁盘,而且没有对存储实施管理。”今年2月,该公司决定采用日立公司的TagmaStore通用存储平台,这个大型阵列不仅可以对其内部存储系统实施虚拟化,而且可以对插入后端的其他厂商的存储系统实施虚拟化。
采用TagmaSore以后,Pacific Capital既保留了在IBM和EMC阵列上的投资,又能完全了解所有后端存储系统的情况,还可以极大地简化所有存储资源的提供过程。Todd说:“我们已经连接了所有核心银行系统、数据仓库和在线银行系统。现在,我们能够准确知道正在使用哪些系统以及怎样对数据分层。”
日立的TagmaStore与IBM和EMC基于网络的产品不同,它在阵列内实现虚拟化,然后用该阵列自己的连接能力连接外部多厂商存储系统。
日立公司的首席技术官Hubert Yoshida解释道:“首先把外部存储系统连接到我们设备的端口上,然后我们的(通用卷管理器)软件搜索总线,以发现连接到设备后部的所有系统的逻辑单元号(LUN),并向控制器超高速缓存提交一个超高速缓存图像。
这样我们就可以对存储系统分层,在设备正常工作的同时,仅通过传递超高速缓存图像,就可以在这些层之间无缝地移动数据了。”
Todd说,分层的关键是减轻管理和资源提供负担。“绝大多数数据,比方说90%或更多,在初次使用之后,再次使用的机会就不是很多了。我们要能够以简单高效的方法把这些数据迁移到较便宜的存储系统上,TagmaStore正好满足了我们的需求。而且如果你需要更大的存储容量,它还可以无缝提供,甚至是在不影响应用正常工作的情况下提供。”
美国芝加哥法律公司Sonnenschein的网络运营经理Eric Muniz说,虚拟化简化了他们的存储环境。Sonnenschein最近在实施数据中心全面整合项目时安装了Sun的StorEdge 6920。“我们需要的存储系统既要具有虚拟化和集中式管理能力,又要具有远程启动、多路径等功能。”Sun的设备刚好满足了他们的要求。
StorEdge 6920与日立的TagmaStore类似,但是更加面向中档市场。Sonnenschein目前在该设备上存储了6TB数据,并计划在最终完成其整合项目时把存储量增加到16TB。该公司还有一些旧的HP/Compaq EMA12000阵列以及一些HP MSA1000。采用Sun的6920以后,可以从一个中央控制台无缝管理这些设备。
Muniz说,他喜欢在Sun控制器单元而不是在网络中实施虚拟化。“比方说,我有一个交换机不用了。如果我是在这个交换机上实现的虚拟化,那么我就要准确知道它涉及哪些虚拟化区并重新对这些区域虚拟化。为了这一个交换机,我可能要把整个SAN都停掉。而6920具有冗余性,本身就避免了这些问题。”
尽管日立和Sun公司选择了阵列虚拟化,但是用户和分析师们说,网络也是一个适合实施虚拟化的地方,尤其对大型存储系统来说,更是这样。
Yankee Group的高级分析师Stephanie Balaouras说:“IBM和EMC实现虚拟化的方法类似,都是在服务器和存储系统之间放置一个路由器。该路由器保留所有路由信息和卷映像。这种方法适用于拥有大量异构存储系统并在存储资源提供上存在大量问题的较大型公司。”
美国佛罗里达一个大型卫生维护组织的存储管理员Karl Rautenstrauch说:“对我们来说,网络是实施虚拟化的合适地方。”这个机构正在评估IBM、EMC和日立的存储虚拟化产品。
他负责管理EMC、惠普和IBM平台上的300TB数据,所有平台都通过的MDS 9509 SAN交换机联网。他说,“我们有这么多数据可用,但并不是每个服务器都能访问这些数据,因为这些数据是按应用提供的。虚拟化将使我们能够更高效地利用现有设备。”
[next]
AOL、美洲银行和花旗银行因数据失窃而使品牌形象大受影响。希望避免这种损失的IT管理人员们都把目光转向了一个古老的安全保障方法:加密。
以Vincent Fusca为例。他是美国新罕布什尔州达特茅斯学院临床医学中心的运营总监,负责7TB的病人医疗数据,这些数据供涉及5000万美元研究经费的研究项目使用。Fusca说:“根据HIPAA法案的规定,我们要确保用最安全的方法保留和使用这些数据。如果这些数据丢失,我就死定了。”
各公司在开发新一代数据中心架构的过程中,越来越重视存储系统的安全性。Enterprise Strategy Group的信息安全高级分析师Jon Oltsik说:“负责存储系统的人们一直只重视性能和可用性,安全性在他们眼里不是问题。但是现在他们开始关注安全问题了。
Fusca采用Decru公司的专用加密设备保护存储服务器和备份磁带的信息安全。Kasten Chase Applied Research、NeoScale Systems、Vormetric等公司也都提供这类专用安全设备。当数据在网络中的主机和遍布企业各处的存储系统之间传递时,这些专用设备对数据进行加密和解密。Fusca用Decru的DataFort把来自医疗保健信息系统的原始文件转换成独立的加密数据单元,供该中心的研究人员、分析师和程序员使用。
Nemertes Research的高级副总裁Andreas Antonopoulos说,过去,IT人员要保证数据安全,必须采用软件。而软件引起的性能下降几乎无法忍受。他说:“专用设备采用尖端ASIC,所有加密工作都在硬件中完成,可实现更高的性能。”
限制加密范围
Antonopoulos说,对数据加密,尤其是对超出高层IT管理人员的物理控制范围、被带到别处的备份数据加密,是个好注意。他认为,尤其是那些加利福尼亚州SB1386等法规适用的公司,更应该这么做。因为这些法规规定,如果数据失窃,必须在30天之内通知失窃数据可能涉及的雇员和客户。但是“加密数据不在此列。因此通过加密,可以保护自己的品牌形象免受损失。”
专家们认为,尽管对所有数据加密可以保证万无一失,但是最好的做法还是有选择地加密数据。按揭贷款公司Ocwen Financial的副总裁Dale Pickford说,他只对大约200TB数据加密,这在其所存储的数据总量中仅占5%。他补充说,对所有数据加密成本太高,也太浪费时间。
Pickford说,首先需要加密的是含有潜在身份信息的数据,如姓名、地址、社会保险号、生日等,任意组合这些信息都可以确定某人的身份。其次需要加密的是贷款、信用状态、账户等细节信息。最后需要锁定“业务敏感”材料。另外,还要保证不想让竞争对手得到的那些信息的安全。
管理加密数据
一旦确定了哪些数据需要加密,就必须决定怎样解密这些数据以及按照什么规则解密。
Pickford采用的是Vormetric公司的CoreGuard加密引擎。他建议,关于谁能看到加密数据和怎样使用加密数据,要制定严格的策略。他说:“必须由合适应用中的合适用户使用合适的机器访问合适的数据库。别无他法。”
他甚至为其下属的IT部门员工制定了严格的数据访问策略。
Fusca则把数据分门别类,然后按照所制订的访问协议,分别装入不同的“保密容器”中,这些访问协议规定谁可以访问什么信息。他解释说:“我们有4个程序员、5个分析师和6个或7个研究员,他们需要不同的病人信息。这些人员登录系统以后,只能访问到他们可以访问的那部分信息。”
Antonopoulos说,高层IT管理人员需要全面控制密钥建立和管理过程。“如果没有非常强大的密钥管理系统,可能丢失所有数据。要确保了解密钥管理和密钥使用条件的所有含意和细节。”
另外,还要定期测试密钥系统。他说:“必须备份密钥,并确定好密钥和磁带的恢复方法,以防发生灾难。备份与恢复缺一不可,因为它们一损俱损。不仅要测试系统,还要测试整个备份恢复过程。磁带在哪里?密钥在哪里?怎样得到这些磁带和密钥?”
Antonopoulos指出,还要考虑加密标准问题。尽管有些专用设备支持多种标准,但是也有些只局限在一个标准上。要根据自己的数据存储需求选择所需标准。“如果有些数据需要长时间保持机密状态,那么就需要设备支持高级加密标准(Advanced Encryption Standard)和大型密钥。”如果数据不那么重要,支持DES就足够了。
安全审计不可或缺
成功实施存储加密的另一个重要方面是在安全审计中加入存储部分。Oltsik说:“应该进行全面的安全审计,将存储基础设施、(访问存储系统的)人员和物理安全包括进去。如果有人带着数据磁带出去或者侵入了网络,也是非同小可的事情,仍然属于数据失窃。”
Oltsik建议,还要进行风险分析,看在成本和性能方面IT部门能够承受多大的额外开销。他说:“尽管存在最低额外开销,但它仍然是额外开销。如果要保证数据安全,就要接受这笔额外开销。有一个美洲银行这样的事故,就足以让人们认识到,3万美元的投资是值得的。”
[next]
新一代数据中心存储聚光灯--归档变得更容易
教皇约翰.保罗二世今年4月去世时,美国《达拉斯晨报》迅速刊发了大量教皇的生平照片。短时间内汇集大量图片,这在不久前还是不现实的事。
以前的问题是,要从磁带库中检索出图片需要大量时间,工作量很大,只有IT部门才能完成这样的任务。去年夏天,在达拉斯晨报社出版系统总监Bob Mason的领导下,该报社把电影带和数字照片都转移到了新型磁盘档案系统中,因此编辑们可以非常迅速地存取数据。
达拉斯晨报社首先认真分析了其业务数据的价值,然后制订了分层存储策略。正像Mason感觉到的那样,数据归档正在成为越来越重要的存储决策之一。Mason说:“我们要建立的不是一个只用两到三年的解决方案,而是一个将持续使用20年之久的解决方案。”
IT咨询公司Sorsythe Solutions Group的存储解决方案总监Jim Geis说,采用分层存储和档案系统意味着,需要确定数据可检索和可用的程度。
ERP或Oracle数据库等业务关键应用一般需要最高的可用性和最快的光纤通道存储系统,而图像应用往往不需要这么快的存取速度,用SATA或UDO等不那么昂贵的存储介质就可以了。但是即使对于偶然需要访问的数据,磁带也几乎不在考虑之列。
就达拉斯晨报社而言,Mason在决定采用磁盘系统之前,研究分析了多种档案介质,如磁光盘、SATA甚至EMC用于内容寻址存储并基于ATA的Centera系统。该报社采用的是Plasmon公司容量为19TB的G638光盘库,这个光盘库支持30GB一次写入UDO磁盘盒。
UDO产品大约两年前开始上市,尺寸为5.25英寸,非常适用于磁带库。除了帮助制订UDO规范的Plasmon公司,IBM和惠普也已经采用了UDO技术。
未来3年,UDO的容量预计会翻一番,达到60GB,然后还会再翻一番,达到120GB。
IDE也在可选之列
不过UDO远非新一代数据中心归档数据的惟一选择。
在美国华盛顿州的Good Samaritan社区医院,台式机中常见的、简单便宜的IDE驱动器就可以符合要求。医院的IT兼运营经理Eric Lowe说,医院每年大约在IDE系统上存档超过3.5万份病人的放射线片子,采用的是Permabit公司的Permeon Compliance Store系统。
Lowe同时把新的放射线片子存储在医院的Picture Archive Communication System(PACS)和IDE系统上。PACS放在一个存储区域网上,由快速高效但昂贵的光纤通道系统组成。6到9个月以后,Lowe就把这些片子从光纤通道SAN上去掉,但是它们仍然保留在Permabit系统上,保留时间从10年至病人去世不等。
Lowe说:“医生们不知道这些片子是在高速光纤通道SAN上还是在速度不那么快的Permabit专用设备上。整个系统对医生来说是透明的。”
在选择Permabit的IDE专用设备时,Lowe考虑了介质成本与数据价值的相对关系。他说:“我承担不起建立另一个光纤通道SAN的成本。我必须找到一种经济的解决方案来存储10TB数据,这些片子不必一直在线。”
与Mason一样,Lowe也拒绝使用磁带库,因为在磁带库中不可能快速存取数据。他所在医院原来也使用一些磁带库,如用于心脏病人医疗数据的归档,但是医院计划,很快就把这些数据迁移到Permeon专用设备上。Lowe说,把心脏病人的数据归档到磁带上“实在不是个好主意”,你不可能让一位心脏病科医生等上两个小时,才能拿到躺在手术台上的病人的医疗数据。
归档的中间道路
美国田纳西州Baptist Memorial Health Care的信息系统工程师Hal Weiss选择了中间道路,他用EMC的Centera归档PACS信息,但是把其他数据存储到Copan Systems公司提供的磁盘系统中。Copan公司的Revolution 200T设备采用了独特的技术,能够只在需要提取数据的时候才旋转磁盘。这可以降低功耗并防止盘片磨损。
另外,Weiss说,Copan的系统能够经济地存储大量数据。他所在的医院每年存储15TB PACS图像和6TB病历。
Centera和Revolution 200T系统采用SATA驱动器,对于今天很多服务器和台式机中常见的并行ATA(或IDE)驱动器来说,SATA驱动器是更快、也更易于配置的替代产品。