Chinaunix首页 | 论坛 | 博客
  • 博客访问: 216946
  • 博文数量: 93
  • 博客积分: 1430
  • 博客等级: 上尉
  • 技术积分: 1060
  • 用 户 组: 普通用户
  • 注册时间: 2006-11-06 09:47
文章分类

全部博文(93)

文章存档

2009年(3)

2008年(26)

2007年(57)

2006年(7)

我的朋友

分类:

2007-01-25 10:44:18

硬件: DELL POWEREDGE 6800 集成RAID卡在主板上(perc 4/di) 做成RAID5,支持硬盘热插拔!
故障现象:一块硬盘的指示灯显示黄色!
DELL工程师说是硬盘故障换了一快硬盘,故障消失!

Array Manager下使硬盘离线

按照图示方法展开AM菜单,在掉线硬盘上点击鼠标右键,弹出菜单后选择offline

Array Manager下使硬盘上线

按照图示方法展开AM菜单,在掉线硬盘上点击鼠标右键,弹出菜单后选择online

Array Manager下对掉线硬盘进行修复

按照图示方法展开AM菜单,在掉线硬盘上点击鼠标右键,弹出菜单后选择rebuild

 

RAID(Redundant Array of Inexpensive/Independent Disks),即廉价/独立磁盘冗余阵列(或简称磁盘阵列)可以把普通的IDE硬盘组成快速安全可靠的存储设备.
 
原理:RAID是一种把多块独立的硬盘按不同方式组合起来形成一个磁盘组,从而提供比单个硬盘更高的存储性能和提供数据冗余的技术。不同的组织方式成为RAID级别(RAID LEVELS)。
数据冗余的功能是在用户数据一旦发生损坏后利用冗余信息可以使损坏的数据得以恢复,从而保障了用户数据的安全性。在用户看起来,组成的磁盘组就像是一个硬盘,对磁盘阵列的操作与单个硬盘一样。
RAID级别:
目前共有0-6共7种基本的RAID级别
常用的RAID级别是LEVEL 0,LEVEL 1 和LEVEL 5      RAID0/RAID1/RAID5
需要RAID控制器(一种PC适配器)也有主板集成来管理硬盘
Linux内核可以模拟RAID控制器,用来管理硬盘,但只支持级别0,1,4,5
RAID 0
RAID 0 又称为Striping.
RAID 0通过把连续的数据访问分散到多个磁盘上来提高存储性能,这样数据请求就可以被多个磁盘并行的执行,每个磁盘执行属于它自己的那部分数据请求,这种数据上的并行操作可以充分利用总线的带宽,显著提高磁盘整体存取性。(分散的放置在各个磁盘,如果一个磁盘坏,其它磁盘数据就没有意义! 速度最快,但最不安全。)
 
RAID 1 又称为Mirror 或Mirroring,它的宗旨是最大限度的保证用户数据的可用性和可修复性。RAID 1的操作方式是把用户写入硬盘的数据百分之百地自动复制到另外一个硬盘上。最安全但是速度比较慢,读写了两次。
 
RAID 5
数据至少需要三个磁盘来存放。磁盘的利用率为((n-1)/n),RAID 5不对存储的数据进行备份,而是把数据和相对的奇偶校验信息存储到组成RAID 5的各个磁盘上,并且奇偶校验信息和相对应的数据分别存储于不同的磁盘上。当RAID 5 的一个磁盘数据发生损坏后,利用剩下的数据和相应的奇偶校验信息去恢复被损坏的数据。综合了磁盘的存储速度和安全性
 
RAID 0+1
是RAID 0 和 RAID 1 的组合形式,也称 RAID 10
 
注意:请预先备份您的数据,配置磁盘阵列的过程将会删除您的硬盘上的所有数据!

一、 为什么要创建逻辑磁盘?

  当硬盘连接到阵列卡(RAID)上时,操作系统将不能直接看到物理的硬盘,因此需要创建成一个一个的被设置为RAID0,1和5等的逻辑磁盘(也叫容器),这样系统才能够正确识别它。
  逻辑磁盘(Logic Drive)、容器(Container)或虚拟磁盘(Virtual Drive)均表示一个意思,他们只是不同阵列卡产商的不同叫法。

二、 创建逻辑磁盘的方式

  使用阵列卡本身的配置工具,即阵列卡的BIOS。(一般用于重装系统或没有安装操作系统的情况下去创建容器(Adaptec阵列卡)/逻辑驱动器(AMI/LSI阵列卡)。
  使用第三方提供的配置工具软件去实现对阵列卡的管理。如Dell Array Manager。(这些软件用于已经安装有操作系统)

三、 正确识别您的阵列卡的型号

  识别您的磁盘阵列控制器(磁盘阵列控制器为可选项, 如果没有购买磁盘阵列控制器的话以该步骤可以省去)

  如果您有一块 AMI/LSI磁盘阵列控制器(PERC2/SC,PERC2/DC,PERC3/SC,PERC3/DC, PERC4/DI, PERC4/DC), 在系统开机自检的时候您将看到以下信息:
  Dell PowerEdge Expandable RAID Controller BIOS X.XX Jun 26.2001 Copyright (C) AMERICAN MEGATRENDS INC.
  Press CTRL+M to Run Configuration Utility or Press  CTRL+H for WebBios
  或者
  PowerEdge Expandable RAID Controller BIOS X.XX Feb 03,2003 Copyright (C) LSI Logic Corp.
  Press CTRL+M to Run Configuration Utility or Press CTRL+H for WebBios
  此款阵列卡的配置方法请参考如下:

在AIM/LSI磁盘阵列控制器上创建Logical Drive (逻辑磁盘)
            --- PERC2/SC,PERC2/DC,PERC3/SC,PERC3/DC,PERC3/DCL
            --- PERC4 DI/DC (略有不同,请仔细阅读下列文档)

*注意:请预先备份您的数据,配置磁盘阵列的过程将会删除您的硬盘上的所有数据!

1) 在自检过程中,当提示按< Control>< M> 键,按下并进入RAID的配置界面。

2) 如果在Cluster 模式下,下列信息将会显示"按任意键继续"。

3) 选中 Configure,并按回车。

4) 如果需要重新配置一个RAID,请选中 New Configuration, 并按回车。
 如果已经存在一个可以使用的逻辑磁盘,请选中 View/Add Configuration,并按回车。
 本文,我们将会选择 "New Configuration"为例(注意: 选择New Configuration将删去原有磁盘阵列上的配置信息)

5) 选中 YES ,并按回车。
6) 按空格键选中准备要创建逻辑磁盘的硬盘,当该逻辑磁盘里最后的一个硬盘被选中后,按回车键。

7) 如果只创建一个逻辑磁盘,则进入步骤8;
 7-1) 按空格键选中第二个逻辑磁盘里的硬盘。
 7-2) 当该逻辑磁盘里最后一个硬盘被选中后,按回车键。
 7-3) 当需要配置更多的逻辑磁盘,重复7.1和7.2步骤直到所有逻辑磁盘被创建。

8) 按F10进行逻辑磁盘的配置。
 当您的阵列卡的类型是PERC4 DI/DC,将显示下列信息,否则请直接到步骤11。
9) 按空格键选择阵列。
跨接信息,例如Span-1(跨接-1),出现在阵列框内。 可以创建多个阵列,然后选择将其跨接。

10) 按F10配置逻辑磁盘。

11) 选择合适的RAID类型,其余接受默认值。
注:Dell 推荐把所有的阵列空间分配给一个逻辑盘。

12)选中 Accept ,并按回车。

13) 按ESC键退回,选中 YES ,并按回车。
14) 按任意键继续。

15) 初始化逻辑磁盘(Logical driver)(刚创建的逻辑磁盘需要经过初始化,才能使用)
 按ESC 键退回主菜单,选中 Initialize ,并按回车。

16) 选中需要初始化的逻辑磁盘,并按空格键接受。

17) 选中 YES ,并按回车。

18) 按任意键继续,并重启系统,RAID配置完成。

LSI RAID BIOS界面下如何做硬盘修复(Perc3/DC,Perc4)

本文档适用于:Perc3/SC/DC/QC或者Perc4/DC/DI或者Perc4E/DI/DC

注意:对阵列以及硬盘操作可能会导致数据丢失,请在做任何操作之前, 确认您的数据已经妥善备份!!!

LSI BIOS界面下如何做硬盘修复
当硬盘配置阵列后,带有冗余的阵列,例如比较常用的RAID1RAID5。在RAID阵列使用中,如果因为某些原因(例如硬盘有坏道,硬盘检测不到,突然关机,断电等等)导致其中一块硬盘的数据未能及时更新,数据与其他硬盘无法同步,RAID卡就会把这块硬盘的状态标识为FAILED。根据RAID级别的算法特性,这样的阵列中允许有一块硬盘出现问题,系统仍然可以继续正常运行。
如果机器能够正常运行,而从外面可以看到一块硬盘闪黄灯,或者LCD上提示DRIVER FAILED,或者RAID卡报警,诸如此类的现象,说明这个时候阵列中有一块硬盘出现问题了。阵列虽然可以用,但是已经处于一个没有安全冗余的级别,要尽快修复!
注意:发现有硬盘状态不正常时,请尽可能先将重要数据妥善备份!!!
修复可以在系统下安装的Array Manager下进行,会有文档专门介绍,这里着重说明如何在LSI RAID BIOS中进行硬盘的修复。在硬盘修复中不需要用到的菜单功能将不着重介绍。
1
 进入LSI RAID BIOS。在机器开机自检过程中按CTRL+M进入。
可以看到界面如下图:

2 为了保险起见,请先确认RAID级别,Objects-Logical Driver,选择要操作的逻辑驱动器,选择View/Update Parameters


 
在弹出的菜单中,需要注意下列几项(建议将上图中红圈内所有的信息记录下来!)
RAID=:RAID级别
Size=:容量
Stripes=:相连接的物理阵列中的磁条(物理驱动器)数量 
Stripe Size=:条带大小
需要特别注意的是
State=:逻辑驱动器状态。分别为OPTIMALDEGRADEDOFFLINE
OPTIMAL
是指逻辑驱动器状态正常,如果一个逻辑驱动器StateOPTIMAL,如上图,说明这个逻辑驱动器状态正常,不需要修复或者已经修复成功。

DEGRADED是指逻辑驱动器处于降级状态,这个时候驱动器还可以被正常访问,但是由于有一个硬盘掉线,所以没有安全冗余。通常在DEGRADED状态下需要做REBUILD修复。


 

OFFLINE是指逻辑驱动器中有两个或两个以上的硬盘掉线,逻辑驱动器处于不可被访问的状态。这个情况后续专门会有文档介绍。

3 确认了机器配置的是RAID5RAID1操作步骤相同)并且State状态是DEGRADED,说明逻辑驱动器需要修复。按ESC键退回至Management Menu菜单,选择Objects-Physical Driver,回车后会有一段时间等待扫描,如下图


 
4
 扫描后可以看到具体的硬盘信息,硬盘的正常状态是ONLINE。当硬盘状态是FAILED时候,说明这个硬盘的数据已经与其他硬盘不同步,所以被RAID卡标识为失败,我们需要做REBUILD修复的就是状态为FAILED的硬盘。
 


5 在做修复之前,建议先检查硬盘的硬件状态,将光标移至硬盘上,按F2。会弹出硬盘信息菜单。需要注意红圈位置Media Errors数量,如果数量较大,请与技术支持工程师联系。
 


6 如果Media Errors数量正常,将光标移至FAILED硬盘上,按回车,弹出菜单,选择REBUILD。选YES确认。

7 开始进行REBUILD修复操作,这个过程可以理解为将另外 硬盘上的数据根据RAID算法还原到这块硬盘,这时可以退出启动系统了,但是由于在这个过程中硬盘读写比较频繁,建议等待REBULD做完(进度条至100%)后再启动系统。这个过程时间会比较长,几个小时或者更久,请耐心等候。

 

8 做完后可以按照刚才操作的方法查看一下,可以看到刚才状态是FAILED的硬盘已经变为ONLIN。至此阵列已经成功修复,查看Logical Driver状态也已经变为OPTIMAL
 
 


 

Linux中的软件RAID
使用linux内核实现的软件RAID控制器
需要内核支持
需要相应的应用软件(raidtools)创建管理RAID设备。
软件RAID设备文件名:
/dev/mdN(N=0,1,2.....)
软件RAID设备可以当分区看待,需要格式化后挂载。
# mkfs.ext3 /dev/md1
# mount /dev/md1 /opt
添加硬盘
RAID设备的成员是硬盘分区,需要先对硬盘分区,分区不能在同一个物理硬盘上
安装raidtools
raidtools中包含有RAID创建管理工具和默然的示范性配置文件
编写配置文件/etc/raidtab可以从raidtools中的示范配置文件里复制
创建RAID设备
# mkraid /dev/md0
 
#df(查看现有的)
添加两个物理硬盘
#fdisk -l /dev/sdb(hda)
#fdisk -l /dev/sdc
分区
#fdisk /dev/sdb
command (m for help): p
.................
.................
command (m for help): n
command action
e extended
p primary partition (1-4)
p
partition number (1-4): 1
使用默认的拄面,两次回车。
w(保存退出)
# rpm -qa raidtools (看是否安装)
# cp /usr/share/doc/raidtools-1.00.3/raidN.conf.sample  /etc/raidtab
# vi /etc/raidtab
 raiddev              /dev/md0(挂载设备名)
 raid-level             1   (RAID级别)
 nr-raid-disks          2
 nr-spare-disks         0
 chunk-size             4
 device                /dev/hda1
 raid-disk              0
 
 device                 /dev/hdb1
 raid-disk               1
 
 
# mkraid /dev/md0 (创建md0设备)
# mkfs.ext3 /dev/md0(格式化md0设备)
# mount /dev/md0 /opt(挂载md0到/opt目录)
#df(查看是否挂载成功)
# lsraid -A -a /dev/md0 (显示的是md0的设备信息)
# umout /dev/opt(卸载opt)
# raidstop /dev/md0 (停止md0)
 
 
 
 
 
 
 
 
 
 
阅读(4833) | 评论(1) | 转发(0) |
给主人留下些什么吧!~~