Chinaunix首页 | 论坛 | 博客
  • 博客访问: 595380
  • 博文数量: 142
  • 博客积分: 10016
  • 博客等级: 上将
  • 技术积分: 1835
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-10 14:30
个人简介

工作中~

文章分类

全部博文(142)

文章存档

2009年(25)

2008年(117)

我的朋友

分类: 服务器与存储

2008-07-31 14:46:32

RAID,为Redundant Arrays of Independent Disks的简称,中文为廉价冗余磁盘阵列。在1987年由美国柏克莱大学提出RAIDRedundant Arrayof Inexpensive Disks)理论,作为高性能的存储系统,巳经得到了越来越广泛的应用。RAID的级别从RAID概念的提出到现在,巳经发展了多个级别,有明确标准级别分别是012345等。但是最常用的是0135四个级别。其他还有67103050等。RAID为使用者降低了成本、增加了执行效率,并提供了系统运行的稳定性。

  RAID 磁盘阵列简单的解释,就是将多台硬盘透过RAID Controller(分Hardware ,Software)结合成虚拟单台大容量的硬盘使用,其特色是多台硬盘同时读取速度加快及提供容错性Fault Tolerant,所以RAID是当成平时主要访问Data的Storage不是Backup Solution。
  在RAID磁盘阵列有一基本概念称为EDAP ( Extended Data Availability and Protection ) ,其强调扩充性及容错机制, 也是各家厂商如: Mylex,IBM, HP, Compaq, Adaptec,Infortrend等诉求的重点,包括在不须停机情况下可处理以下动作:
  RAID 磁盘阵列支持自动检测故障硬盘;
  RAID 磁盘阵列支持重建硬盘坏轨的资料;
  RAID 磁盘阵列支持不须停机的硬盘备援 Hot Spare;
  RAID 磁盘阵列支持不须停机的硬盘替换 Hot Swap;
  RAID 磁盘阵列支持扩充硬盘容量等。

标准的RAID写操作,包括如:RAID4RAID5中所必需的校验计算,需包括以下几个步骤:
1)以校验盘中读取数据
2)以目标数据盘中读取数据
3)以旧校验数据,新数据及已存在数据,生成新的校验数据
4)将新校验数据写入校验盘
5)将新数据写入目标数据盘
当主机将一个待写入阵列RAID组中的数据发送到阵列时,阵列控制器将该数据保存在缓存中并立即报告主机该数据的写入工作已完成。该数据写入到阵列硬盘的工作由阵列控制器完成,该数据可继续存放在Cache中直到Cache满,而且要为新数据腾出空间而必须刷新时或阵列需停机时,控制器会及时将该数据从Cache写入阵列硬盘中。 
  这种缓存回写技术使得主机不必等待RAID校验计算过程的完成,即可处理下一个读写任务,这样,主机的读写效率大为增加。当主机命令将一个数据写入硬盘,则阵列控制器将该数据写入缓存最上面的位置,只有新数据才会被控制器按Write-Back Cache的方式最后写入硬盘。

RAID
级别

NRAID

  硬盘连续使用。NRAID 意思是不使用RAID功能。它使用硬盘的总容量组成逻辑碟(不使用条块读写)。换句话说,它生成的逻辑碟容量就是物理碟容量的总和。此外,NRAID 不提供资料的备余。

JBOD

JBOD
的含意是控制器将机器上每颗硬盘都当作单独的硬盘处理,因此每颗硬盘都被当作单颗独立的逻辑碟使用。此外,JBOD并不提供资料备余的功能。


RAID0RAID 0 - Disk Stripping without parity (常用)                 
 

又称数据分块,即把数据分成若干相等大小的小块,并把它们写到阵列上不同的硬盘上,这种技术又称"Stripping"(即将数据条带化),这种把数据分布在多个盘上,在读写时是以并行的方式对各硬盘同时进行操作。 所以,在所有的级别中,RAID 0的速度是最快的。但是RAID 0没有冗余功能,如果一个磁盘(物理)损坏,则所有的数据都会丢失。从理论上讲,其容量和数据传输率是单个硬盘的N倍(N为构成RAID0的硬盘总数),但实际上受限于总线I/O瓶颈及其它因素的影响,RAID 效能会随边际递减,也就是说,假设一个磁盘的效能是50MB/秒,两个磁盘的RAID 0效能约96MB/秒,三个磁盘的RAID 0也许是130MB/秒而不是150MB/秒。所以,两个磁盘的RAID 0最能明显感受到效能的提升。若阵列控制器有多个硬盘通道时,对多个通道上的硬盘进行RAID0操作,I/O性能会更高。因此常用于图象,视频等领域,RAID0 I/O传输率较高,但平均故障时间MTTF只有单盘的N分之一,因此RAID0可靠性最差。
所需最少硬盘数:2块或多块          
可靠性是单独一块盘的1/N             
同时读磁盘数:N
同时写磁盘数:N
磁盘利用率:N


RAID1RAID 1 - Disk Mirroring(较常用)                                        

又称镜像。即每个工作盘都有一个镜像盘,每次写数据时必须同时写入镜像盘,读数据时只从工作盘读出,一旦工作盘发生故障立即转入镜像盘,从镜像盘中读出数据。
即当主硬盘损坏时,镜像硬盘就可以代替主硬盘工作。镜像硬盘相当于一个备份盘,可想而知,这种硬盘模式的安全性是非常高的,RAID 1的数据安全性在所有的RAID级别上来说是最好的。但是其磁盘的利用率却只有50%,是所有RAID级别中最低的。当更换故障盘后,数据可以重构,恢复工作盘正确数据,这种阵列可靠性很高,但其有效容量减小到总容量一半以下,因此RAID1常用于对容错要求极严的应用场合,如财政、金融等领域。RAID 1也可以提高读的性能, 当原始数据繁忙时, 可直接从镜像拷贝中读取数据。
所需最少硬盘数:2块或偶数块(每块盘都有对应的镜像盘)
同时读磁盘数:N
同时写磁盘数:N/2
磁盘利用率:N/2 50%
RAID (0+1)
结合了RAID 0 RAID 1 — 条块化读写的同时使用镜像操作。 RAID (0+1) 允许多个硬盘损坏,因为它完全使用硬盘来实现资料备余。如果有超过两个硬盘做RAID 1,系统会自动实现RAID (0+1)

RAID2

又称位交叉.
从概念上讲, RAID 2 同RAID 3类似, 两者都是将数据条块化分布于不同的硬盘上, 条块单位为位或字节. 然而RAID 2采用汉明码(Hamming Code)作盘错校验,采用按位交叉存取,运用于大数据的读写,但冗余信息开销太大(校验盘为多个),这种编码技术此,在商业环境中很少使用。


RAID3
RAID 3 - Parallel Disk Array          
 

为单盘容错并行传输。即采用Stripping技 术将数据分块,对这些块进行异或校验,校验数据写到最后一个硬盘上。它的特点是有一个盘为校验盘,数据以位或字节的方式存于各盘(分散记录在组内相同扇区 的各个硬盘上)。当一个硬盘发生故障,除故障盘外,写操作将继续对数据盘和校验盘进行操作。而读操作是通过对剩余数据盘和校验盘的异或计算重构故障盘上应 有的数据来进行的。RAID3的优点是并行I/O传输和单盘容错,具有很高可靠性。缺点:每次读写要牵动整个组,每次只能完成一次I/O
所需最少硬盘数:至少3(一块作校验盘,其它盘作存贮
磁盘利用率:N-1 N-1/N 85%


RAID4


RAID3相似,区别是:RAID3是按位或字节交叉存取,而RAID4是按块(扇区)存取,可以单独地对某个盘进行操作,无须像RAID3那样,哪怕每一次小I/O操作也要涉及全组,只需涉及组中两块硬盘(一块数据盘,一块校验盘)即可,从而提高了小量数据I/O速度。缺点:对于随机分散的小数据量I/O,固定的校验盘又成为I/O瓶颈,例如:事务处理。作两个很小的写操作,一个写在drive2stripe1 上,一个写在drive3stripe2上,它们都要往校验盘上写,所以发生争用校验盘的问题。


RAID5
RAID 5 - Striping with floating parity drive(最常用)
 

是一种旋转奇偶校验独立存取的阵列方式,它与RAID3RAID4不同的是没有固定的校验盘,而是按某种规则把奇偶校验信息均匀地分布在阵列所属的硬盘上,所以在每块硬盘上,既有数据信息也有校验信息。这一改变解决了争用校验盘的问题,使得在同一组内并发进行多个写操作。所以RAID5即适用于大数据量的操作,也适用于各种事务处理,它是一种快速、大容量和容错分布合理的磁盘阵列。当有N块阵列盘时,用户空间为N-1块盘容量。

RAID3
RAID5中,在一块硬盘发生故障后,RAID组从ONLINE变为DEGRADED方式,但I/O读写不受影响,直到故障盘恢复。但如果DEGRADED状态下,又有第二块盘故障,整个RAID组的数据将丢失。
所需最少硬盘数:至少3(各盘互为校验互为存贮)

同时读磁盘数:N
同时写磁盘数:1
磁盘利用率:N-1 N-1/N



RAID 6:
 
RAID 6 与RAID 5相比,增加了第二个独立的奇偶校验信息块. 两个独立的奇偶系统使用不同的算法, 数据的可靠性非常高. 即使两块磁盘同时失效,也不会影响数据的使用. 但需要分配给奇偶校验信息更大的磁盘空间, 相对于RAID 5有更大的"写损失". RAID 6 的写性能非常差, 较差的性能和复杂的实施使得RAID 6很少使用.


RAID技术的应用

DAS --direct access storage device
直接访问存储设备
DAS
是磁盘存储设备的术语,以前被用在大、中型机上。使用在PC机上还包括硬盘设备DAS的最新形式是RAID"直接访问"指访问所有数据的时间是相同的。

NAS --Network Attached Storage
网络附加存储设备
一种特殊目的的服务器,它具有嵌入式的软件系统,可以通过网络对个种的系统平台提供文件共享服务

SAN --Storage Area Networks
存储区域网
一种高速的专用网络,用于建立服务器、磁盘阵列和磁带库之间的一种直接联接。它如同扩展的存储器总线,将专用的集线器、交换器以及网关或桥路互相连接在一起。 SAN 常使用光纤通道。一个 SAN 可以是本地的或者是远程的,也可以是共享的或者是专用的。SAN 打破了存储器与服务器之间的束缚,允许你独立地选择最佳的存储器或者是最佳的服务器,从而提高可扩性和灵活性。
阅读(1278) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~