彻底解析连续数据保护CDP (下)
CDP 产品报导─DataCore Traveller CPR
Traveller是一套SAN储存端架构的连续数据保护(CDP)软件,可为前端服务器指定磁盘区提供连续、无还原时间点限制的还原能力。
SAN 储存虚拟化架构
Traveller的CDP功能,是建立在DataCore SANSymphony储存虚拟化平台上的一种延伸应用。
SANSymphony 是Windows平台的储存虚拟化软件,可将自身介接的储存装置空间构成储存池,再依需要将储存池仿真成虚拟磁盘,并透过FC或iSCSI通道挂载给前端指定的服务器。
由于前端服务器与后端储存装置之间的存取动作,都须透过SANSymphony的中介,因此也让SANSymphony服务器成为单点故障的来源,所以DataCore提供了高可用性架构,透过两台SANSymphony服务器建立起镜像磁盘,当其中一台SANSymphony服务器失效时,前端服务器仍可从备援的镜像磁盘维持存取。
复制与I/O时间纪录的结合
用户必须先准备好两台SANSymphony服务器,为磁盘区建立起镜像关系,然后再把Traveller服务器的磁盘区加入镜像群组。接下来当前端服务器将数据写入第1台SANSymphony服务器提供的虚拟磁盘时,数据除了会复制一份到第2台SANSymphony服务器的虚拟磁盘构成镜像外,也会复制一份到Traveller服务器的磁盘区。
Traveller 服务器不会跟着原始磁盘区区块变化,更动自身的参考磁盘区,而会替每笔新写入的数据都加上时间戳记,并个别存放于缓冲区(Buffer)。缓冲区大小对应于需要连续保护的时间长短,称为保留时间(Retention Time),超过保留时间的数据,就会被送到参考磁盘区成为基底的一部分。
需要还原特定时间点的数据时,Traveller会参照缓冲区中每笔数据的时间戳记,搭配参考磁盘区中的基底数据,组合出指定时间点下的磁盘复本。
但只有保留时间内(缓冲区中存在)的数据,才能提供无时间点限制的还原功能。
由于Traveller是依靠SANSymphony来撷取写入数据,故无须在前端服务器安装代理程序,也没有支持平台的问题,只要前端服务器是存取SANSymphony提供的虚拟磁盘,就能由Traveller提供CDP保护。
即使Traveller发生问题,也不会影响到SANSymphony作业。
滑杆式数据保留时间设定
CDP会捕捉、复制并保存被保护磁盘的每一笔写入数据,因此保护时间越长,或写入动作越频繁,CDP所需保存的复本数据量也越大。因此如何依被保护磁盘的原始容量、写入状况,以及执行保护时间的长短,来评估复本磁盘区需求容量,一直是管理人员相当头痛的问题。
为解决这个问题,Traveller贴心的提供了滑杆式设定接口来协助用户。当用户为前端磁盘区设定参考磁盘区时,可利用滑杆接口,设定该磁盘需要的CDP连续回溯时间长短(即保留时间),设定的保留时间越长,那么占用的缓冲区也越大。
Traveller 会依前端磁盘的写入频率,自动估算保留时间该磁盘内需占用的缓冲区大小,供管理者参考。随着写入行为的变化,系统估算的缓冲区容量也会跟着变化,让管理者能更精确地掌握缓冲区使用状况。
精细到分钟的「回滚」还原操作
CDP的号召是无时间点限制的还原能力,不过也由于这个特性,若没有事先的指引,要从保留时间中找出所要时间点的数据也不是易事,为方便操作,Traveller提供了两种还原模式。
首先是自行指定还原时间的Rollback回滚原,使用者可从日历式还原接口显示的保留时间中,任意选择时间点还原。接下来系统即会将该时间点的数据制成Rollback磁盘区,再挂载给指定服务器检视数据。
另一种是利用「标记(marker)」的回滚还原,在前端服务器运行时,可利用Traveller工具程序于特定时间送出一个标记,日后要还原时,可直接以标记的时间点制作Rollback磁盘。这种模式对保护数据库特别有用,用户可利用Script定期清除内存中的数据、将数据写入磁盘,同时向Traveller发出标记讯息。日后还原时,就能直接以标记的时间点还原,确保还原的完整性。
CDP 产品报导─EMC RecoverPoint/SE 3.0
EMC RecoverPoint是一套数据保护应用服务器,可提供无还原点限制的连续数据保护与远程复制服务,并支持主机端、服务器端与储存端三种布署架构。
涵盖区域与跨远程保护
RecoverPoint可分标准版与SE两种版本,SE版是与Clariion储存设备搭售的版本。依应用环境又可分为针对本地端的CDP(Continuous Data Protection)、跨广域网络的CRR(Continuous Remote Replication),以及兼顾本地端与异地端的CLR(Concurrent Local and Remote)三种版本。
RecoverPoint CDP 专门对应本地端环境,CRR则只能够对应跨WAN的环境,可为本地端需要保护的磁盘区,在异地端建立复本磁盘;CLR则能同时支持本地端与异地端的保护,除在本地端为需要保护的磁盘区建立复本外,还能在异地端为这个磁盘区再建立一份复本,提供多一层的保护。三种版本间可由低而高逐步升级。
复制与时间戳记的结合
对于前端需要保护的磁盘,RecoverPoint是以「一致性群组(Consistency Group)」的方式运作,每个群组可包含1个或多个来源磁盘。
执行时,当前端主机的磁盘有任何数据写入时,这些数据都会被复制一份并送到RecoverPoint服务器,接下来RecoverPoint服务器会替写入数据加上时间戳记,然后送到Journal磁盘上个别存放。
Journal 磁盘一般是设定为相当于来源磁盘20%的容量,当写入的数据量超出Journal磁盘后,旧数据就会自动挪到Replica磁盘上。
不过挪到Replica磁盘的数据,就会失去时间戳记,因此只有位于Journal磁盘中的数据,才能提供无还原时间点限制的功能。而Replica磁盘就相当于做为基底的复本磁盘。
需要还原时,只要数据还在Journal磁盘中,就可指定任意还原时间点,系统会查询Journal磁盘中每笔数据的时间戳记,捞出符合指定时间点的数据,加上做为基底的Replica磁盘,组合出等同于来源磁盘在指定时间点下的复本。
RecoverPoint 也提供了「快照」式的保护模式,可节省磁盘空间的耗用。快照模式下,RecoverPoint就相当于区块层级的备份软件,依靠排程定期撷取来源磁盘的异动区块,而不是连续撷取。
弹性的部署架构
RecoverPoint是以应用服务器方式销售,运作方式为复制结合连续保存写入数据的两段式机制,其中连续保存写入数据并加上时间戳记的工作,是由RecoverPoint本身负责,而如何将写入来源磁盘的数据复制到RecoverPoint,则有3种方式。
第1种是主机端机制,也就是在受保护主机上安装Splitter代理程序。只要一有数据写入来源磁盘,Splitter就会复制一份送到RecoverPoint。
第2种是网络端机制,用户环境若拥有Brocade AP-7600或Cisco MDS系列SAN交换器,可利用交换器内建功能,将前端服务器写入来源磁盘的数据,另外复制一份送到RecoverPoint。
第3种方式为储存端机制,若用户拥有EMC Clariion储存设备时,可将Clariion Write Splitter程序安装到控制器微码中,即可利用Clariion直接将被写入来源磁盘的数据复制到RecoverPoint。
多样化的还原模式
RecoverPoint的还原点选择与还原操作均有多种模式。在还原方面,可直接挑选最新的一个时间点;或是从时间戳记选单中挑选,系统会将Journal保存的数据以时间戳记列出;也支持时可从日历选单中选择还原点,挑选的精细度可达微秒。
在利用时间戳记选单中挑选还原点时,特别值得一提的是可事先附加在时间戳记上的「书签(bookmark)」指引功能。
书签是由管理者透过RecoverPoint控制台、或由前端应用程序透过Script产生的标记讯息。用户可在特色时间向RecoverPoint送出书签信号,以便还原时可直接选出此时间点的复本。
在还原操作方面,用户可利用Journal磁盘数据直接将来源磁盘Roll-Back到指定时间点的状态。来源磁盘将会被「时光回溯」到过去某个时间点的状态。
若只想找出特定的档案还原,不想更动整个来源磁盘,则可将特定时间点下的复本,构成1个新磁盘,然后挂载到指定主机上检视。另外也可直接利用Journal磁盘的数据组成Virtual LUN挂载给指定主机使用,此时将不会用到Replica中的基底数据。
CDP 产品报导─FalconStor CDP
FalconStor CDP原是一套复制结合快照的数据保护产品,最新版本添加了连续数据保护功能,可连续撷取受保护磁盘的写入I/O,并提供不受时间点限制的任意还原能力。
频繁快照再进化
FalconStor CDP是最早的复制结合快照产品之ㄧ,也就是透过代理程序,先将前端受保护主机的磁盘数据,复制到后端CDP服务器的镜像磁盘,然后再利用快照技术,为镜像磁盘制作不同时间点的复本。
这种称作「频繁快照」的解决方案,仅管可提供远高于传统备份的还原精细度,每数小时便能制作一次快照复本,但无论快照频率再密集,仍存在着还原时间点限制,用户只能将数据还原到制作还原点的那个时间,而无法回到两次快照之间的状态,因此与真正的「连续数据保护」还有一定的距离。
最新版的FalconStor CDP则摆脱了这个限制,藉由新增的CDP Journal模式,可连续捕捉每个写入I/O,并提供任意时间点的还原能力。
CDP Journal 是奠基在FalconStor CDP原有的镜像复制功能上,原本的镜像复制是让CDP服务器上的复本磁盘与前端磁盘间维持同步,两者没有时间点的区别,前端的变动,后端也会跟着发生,磁盘的最新状态会覆盖旧状态。
当CDP服务器上的复本磁盘启用CDP Journal模式后,系统将不会让新状态覆盖旧状态,而会替每笔写进的数据都加上时间标记,然后个别存放。还原时则可透过滑杆式接口,任意指定需要还原的时间点,系统将会从Journal磁盘区组成该时间点下的复本磁盘,用户可将复本磁盘挂载给指定主机检视数据或还原。
弹性的部署架构
如前所述,FalconStor CDP Journal的运作为两段式,先把数据从前端磁盘复制到后端的CDP Journal磁盘,然后再为每笔写入I/O加上时间标记。同类产品的机制也大致相似,但FalconStor CDP的特色是可支持主机端、网络端与储存端等三种部署架构,主要差异在于执行数据复制的环节不同。
储存端与网络端架构都无须安装DiskSafe代理程序,不过也由于前端主机不存在代理程序,这两种架构都只能由后端的服务器进行相关建置设定。相形下主机端架构,可允许前端用户自行透过DiskSafe代理程序呼叫后端CDP服务器执行设定工作。
主机端部署
即透过前端主机上安装的DiskSafe代理程序执行复制,DiskSafe会将任何写入前端磁盘的数据,复制到CDP服务器的复本磁盘。只要在建立保护关系时勾选CDP Journal选项,就能通知后端CDP服务器进行相应的处理。
网络端部署
若用户拥有Cisco的MDS 9000系列光纤信道交换器,则可利用交换器来执行数据镜像复制动作。当前端服务器将数据经由交换器写入后端SAN储存装置的磁盘区时,交换器会自动将写入数据复制一份,并送到CDP服务器上的复本磁盘区。如此也就免除了在前端服务器部署代理程序的必要。
储存端部署
这个架构同样无需在前端服务器部署代理程序,但需搭配FalconStor的CDP-X储存服务器,CDP-X是一种SAN虚拟化储存网关器,搭配FalconStor CDP时,亦可将自身介接的磁盘区,与CDP服务器的磁盘区建立镜像,只要前端服务器将数据写入CDP-X提供的磁盘区,CDP-X即会将写入的数据复制一份到CDP服务器的磁盘区。
快照与CDP的结合
FalconStor CDP另一特色是兼具快照与CDP Journal两种保护模式。TimeMark快照是系统原有功能,虽然有还原时间点(通常为一小时一次)与复本保留份数限制(最多255份),但优点是可搭配Script或特定应用程序的代理程序,确保撷取下来的快照复本可用性。而CDP Journal缺乏与特定应用程序间的配合机制,但能提供比快照更致密的还原时间点。
FalconStor CDP 可混用两种模式,视前端服务器执行的应用程序类型,分别选择快照或CDP Journal作为保护机制,也可针对同一台被保护磁盘区,平时以CDP Journal提供无间断的数据纪录,再定期利用快照撷取更可靠的复本,兼取两者之长。
CDP 产品报导─IBM TSM FastBack
Tivoli Storage Manager(TSM) FastBack是一套区块级(Block Level)的Windows平台备份软件,除了传统的时间驱动排程机制外,还可提供连续数据保护(CDP)功能,提供无时间点限制的还原能力。用户可视需要在备份排程中组合快照或连续数据保护,另外还支持远程复制功能,以供灾难复原使用。
TSM FastBack 原本是FilesX公司的产品Xpress Restore,当IBM于今年4月并购FilesX后,这套产品也被纳入IBM TSM数据保护产品家族中。
区块级的增量备份
TSM FastBack的架构与传统备份软件相同,由部署在前端主机上的代理程序,搭配后端负责作业政策设定、管理与控制备份储存媒体的FastBack服务器组成。
FastBack 与传统备份软件不同之处,在于采用了区块级增量备份。
FastBack的代理程序可以区块为单位来扫描磁盘,能追踪区块层级的变化,因此FastBack的增量备份只传送异动区块,而不会传送整个档案,备份传输效率大为提高。FastBack把这种备份方式称为快照(Snapshot),第一次启动备份作业时,会先执行一次全快照(Full Snapshot),接下来的备份作业都将以增量快照(Increamation Snapshot)方式进行,只撷取来源磁盘的异动数据区块。
从区块增量备份到CDP
建置时,用户须先选择一台服务器作为FastBack服务器,然后为前端所有需要保护的主机部署代理程序,至于复本的存放空间(称为容器Repository),则为FastBack服务器可存取的本机磁盘、SAN储存设备磁盘区或是档案夹。
FastBack 的备份启动机制可分两大类,第一类是传统以时间点为启动基准的作法,可为来源磁盘设定备份排程,也可手动随时启动快照。代理程序只有在到达预设时间、或收到手动下达的启动指令时,才会扫描磁盘区块,并将异动区块备份到FastBack服务器。
另一类则是连续数据保护(CDP)机制,在备份排程中勾选CDP选项后,代理程序将会「持续不断」追踪来源磁盘的区块状态,只要来源磁盘区块发生任何异动,代理程序就会立即把异动区块备份到FastBack服务器。
以时间点启动的增量快照消耗资源较少,代理程序只在预设的时间点才会动作,并向后端传输数据,所以只有这段时间才会占用网络频宽。但还原时,也只能选择预设的时间点来还原。
CDP 模式下,代理程序无时无刻都在动作中,只要有数据写入磁盘导致磁盘区块发生异动,代理程序就会将异动区块备份到后端,占用频宽将成为常态,而后端FastBack服务器则必须纪录来源磁盘每一笔的异动区块,消耗的储存空间相对高出许多。但这种方式保存了来源磁盘区块的每笔异动,因此还原时可将来源磁盘还原到过去任一个时间点的状态。
高弹性的备份机制搭配
FastBack的两种备份机制各有优缺点,按时间点的机制,消耗资源小,但还原弹性低;CDP消耗资源大,但拥有无限制的还原选择弹性。不过FastBack的用户并无需在选择哪一种模式上伤脑筋,系统提供了混合搭配的机制,可在备份政策中同时纳入CDP与传统的按时间排程,用户可视自身环境的特性,灵活的搭配两种备份模式。
如可设定在数据存取最频繁的8小时上班时段中启动CDP,以记录来源磁盘的每一次异动。而在下班后的16小时,由于存取频率低、数据异动小,则可改成每隔数小时启动一次增量快照,如此就能兼顾还原弹性与资源消耗。
还原时,用户可从预设的还原时间点(排程增量快照模式)或滑杆式选单中任意挑选时间点(CDP),并透过以下2种方式将数据还原:利用「磁盘区(Volume)等级还原」将指定时间点的复本还原到原始磁盘。可同时适用增量快照与CDP备份。
增量快照还能利用「FastBack挂载」将复本构成1个虚拟磁盘,挂载到本机成为可擦写的新磁盘驱动器,不过这个数据夹虽允许写入新数据,但新数据是存放于内存中,因此断电或重开机后,写入的新数据将会遗失。这个模式也提供立即还原(Instant Restore)选项,可在还原尚未完成时,就允许用户存取还原磁盘区。另外「FastBack挂载」除可于FastBack服务器执行外,也可独立安装到任何Windows平台主机,只要该主机能读取FastBack的Repository区,用户将能从任何位置启动该作业。
阅读(1759) | 评论(0) | 转发(0) |