Chinaunix首页 | 论坛 | 博客
  • 博客访问: 3386515
  • 博文数量: 631
  • 博客积分: 10716
  • 博客等级: 上将
  • 技术积分: 8397
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-01 22:35
文章分类

全部博文(631)

文章存档

2020年(2)

2019年(22)

2018年(4)

2017年(37)

2016年(22)

2015年(1)

2013年(12)

2012年(20)

2011年(19)

2010年(20)

2009年(282)

2008年(190)

分类: Oracle

2009-02-16 12:49:05

网上写实验过程的多,写实验总结的少,然而实验总结就像舞台上那一分钟,与之对应的是台下十年功啊。我写“vmware+linux+oracle rac 全过程”专题写了两天,但做这个实验却花了我大约两个星期的时间,所以再花上那么三、四十分钟写一份总结,稍带把整个实验过程给回顾一遍,顺利的、不顺利的,统统走上那么一遭,也是非常值得的。
 
首先,我要数数那数十次重配虚拟机+重装linux操作系统的经历,其中有几次重复,皆是没有找到解决某个具体问题的办法,不得已而为之,剩下的都是不得不做。
第一次,在新建虚拟机时选择SCSI为I/O适配器类型,在选择适配器驱动的时候错选了BUS类型,导致安装linux操作系统的时候找不到可用的磁盘,系统报错,重装;
第二次,新建虚拟机时选择IDE为I/O适配器类型,也安装了linux操作系统,结果在创建裸设备的时候突然发现可用磁盘不够,因为系统默认只能创建四个IDE设备,光驱占去一块,本地磁盘占去一块,ocr和vote磁盘占去一块,这样一来没有足够的裸设备用来安装ORACLE数据库了,重装;
第三次,安装linux操作系统过程中(安装在移动硬盘上的某个分区),因为移动硬盘与笔记本电脑的USB连线发生意外故障,导致安装过程中断,操作无法继续进行,重装;
第四次,给系统打补丁时因为系统版本不一致,补丁打完重启系统后直接进入黑屏时代,怎么拨弄都毫无反应,重装;
第五次,安装linux操作系统时把裸设备和本地磁盘放到同一卷组里面,在对裸设备强制分区,重启后系统报严重错误,无法启动,重装;
第六次,因为没有找到问题所在,所有操作按第五次同样进行,到磁盘分区时又出现相同问题,故障发生后找到了问题所在,但系统已经无法拯救,重装;
第七次,一直没有注意新建虚拟机时将本地磁盘和裸设备放在了同一个文件夹,系统克隆的时候原封不动的拷贝了本地磁盘和裸设备文件,导致配置共享磁盘的时候无法识别到主节点创建的卷VOL1/VOL2,以为跟ASM的配置过程有关,重装;
第八次,重复第七次所有操作,到配置ASM磁盘的时候仍然无法识别到主节点创建的卷VOL1/VOL2,没有找到问题所在,重装;
第九次,注意到了克隆系统时候的问题,在RAC2节点上fdisk -l,也出来四块磁盘(相当于RAC2所独有的设备文件)。创建共享磁盘的时候果然失败,但庆幸的是总算是找到问题所在了,很高兴的重装;
第十次,这次严格意义上不算是一次故障,而是为了二次实验特地挑了移动硬盘上另一个50GB大小的分区把实验从头到尾做了一遍,又全程截图,这次操作很顺利,因为之前遇到的所有故障都清扫了。
 
其实出现的这些故障当中,有些故障是不需要重装系统的,但为了保证实验质量,毅然决然的采取了最极端的方式,牺牲一些时间,为的是得到一个比较良好的实验状态。每一次故障解决都是一次经验的积累,技术的提升,这样想来,花那么长时间在linux系统下做一个ORACLE RAC实验也是值得的。
 
这次实验时间开销大,是因为之前没有用过linux的系统,这次索性从安装操作系统做起,通过实验的进行也熟悉了linux下怎么设置FTP、telnet,怎么设置静态、动态IP地址,怎么打补丁,怎么磁盘分区,怎么时间同步,怎么创建文件系统,怎么创建ASM磁盘等等,获益匪浅。其实linux系统学起来也不难,没有必要对着一堆又一堆的参考资料、官方文档从头到尾的看,关键还是多动手,通过动手来获取知识,这便是最好的方法论。
 
总结起来,在vmware下使用linux操作系统为介质来搭建ORACLE RAC环境,主要注意以下几点:
1,新建虚拟机时选择SCSI为I/O适配器类型,使用LSI logic驱动,这样可以拥有实验用足够的磁盘(针对vmware 1.0.6版本);
2,本地磁盘和裸设备文件分而置之,避免系统克隆时把裸设备文件也拷贝过去;
3,安装linux操作系统时,切勿将本地磁盘和裸设备文件划分到同一个卷组当中;
4,打补丁时切记对应正确操作系统版本,否则得不偿失;
5,对任何磁盘做“删除分区”这个动作前多想想此操作是否得当;
6,面对vip漂移的问题,先考虑是否拥有默认网关;
7,无论是安装clusterware还是安装database的时候,遇到报错信息,一定要学会看日志,虽然有的时候不一定管用;
8,足够的耐心。
(全文完)
 
 
查看全文
发表于:2009-01-04 ┆ 阅读(396)评论(4)

vmware+linux+oracle10g rac全过程(十九):安装database_3

在进行数据库的创建和ASM实例的安装之前,我们要确保三件事,一要确保两个节点的CRS进程都已经起来,二要确保两个节点的监听进程都已经启动,三要确保vip都运行在各自的节点上,不能发生vip飘移的现象,否则ASM实例的创建过程会出问题。这三点无误,那么下面来到数据库以及ASM实例的创建过程:

 

1,仍然在RAC1节点上,以oracle用户登陆,运行dbca:


2,选择RAC方式创建数据库,点击“next”:

3,选择“创建一个数据库”,点击“next”:

4,选上两个节点RAC1和RAC2,点击“next”:


5,选择“Custom Database”,点击“next”:

6,创建数据库名为“RACDB”,点击“next”:
查看全文
发表于:2009-01-04 ┆ 阅读(243)评论(0)

vmware+linux+oracle10g rac全过程(十八):安装database_2

数据库软件安装完成之后,接下来要做的是给两个节点配置listener,也就是监听。监听在ORACLE RAC中的地位非常重要,如果监听没有配置好,后期使用RAC方式建立实例就会出问题,下面在RAC1节点上以oracle身份登陆,运行netca,打开网络配置,来完成监听过程的全过程。

 

1,通过oracle运行netca,打开网络配置界面,选择cluster配置方式,点击“next”:

2,选中两个节点,点击“next”:


3,选择监听配置模式,点击“next”:


4,选择“添加”,点击“next”:
查看全文
发表于:2009-01-04 ┆ 阅读(178)评论(2)

vmware+linux+oracle10g rac全过程(十七):安装database_1

clusterware软件安装结束,在各自节点也看到了CRS进程,下面继续database数据库软件的安装过程,因为这个过程比较简单,这里就简要奉上截图:

1,上传10201_database_linux32.zip到“ly_media”文件系统,以unzip命令解压database软件,赋予正确的权限和属主,再以oracle身份登陆进行安装:


2,弹出oracle安装界面:


3,点击“next”:

4,oraInventory仍然使用系统默认的路径,点击“next”:


5,选择企业版安装方式,点击“next”:
查看全文
发表于:2009-01-04 ┆ 阅读(179)评论(1)

vmware+linux+oracle10g rac全过程(十六):clusterware安装_3

这里附上各节点执行sh脚本的一些情况:

 

1,RAC1节点执行orainstRoot.sh:


2,RAC2节点执行orainstRoot.sh:


3,RAC1节点执行root.sh:

 


到这里前期的执行都是没有问题的。从RAC2开始执行root.sh这一刻起,问题来了,下面就着问题给出正确的解决方案:

 

4,RAC2节点上执行root.sh之前需要编辑两个文件,这两个文件都位于/opt/ora10g/product/10.2.0/crs_1/bin下,文件名分别为vipca和srvctl。首先编辑vipca文件,找到如下内容:

Remove this workaround when the bug 3937317 is fixed
arch=`uname -m`

if [ "$arch" = "i686" -o "$arch" = "ia64" ]
then
LD_ASSUME_KERNEL=2.4.19
export LD_ASSUME_KERNEL
fi
#End workaround
在fi 后新添加一行:
unset LD_ASSUME_KERNEL

 

然后编辑srvctl文件,找到如下内容:
LD_ASSUME_KERNEL=2.4.19
export LD_ASSUME_KERNEL
同样在其后新增加一行:
unset LD_ASSUME_KERNEL

 

对应的报错信息是:

/opt/ora10g/product/10.2.0/crs_1/jdk/jre//bin/java: error while loading shared libraries: libpthread.so.0:
cannot open shared object file: No such file or directory

5,然后到RAC2节点下用root用户身份执行/opt/ora10g/product/10.2.0/crs_1下的root.sh:

 

查看全文
发表于:2009-01-04 ┆ 阅读(157)评论(0)

vmware+linux+oracle10g rac全过程(十五):clusterware安装_2
接着上回说,下面要导入裸设备文件ocr跟vote。
 
1,导入ocr所对应裸设备路径,点击“next”:
 
2,导入“vote”所对应裸设备路径,点击“next”:
 
3,磁盘、网络、安装路径设置完之后,下面开始正式的安装过程:
 
 
 
主节点安装完成后,系统会自动往RAC2对应目录下拷贝clusterware的所有文件。
 
4,献上一幅美图:
从这个图上可以看出系统的繁忙程度,在进行远程拷贝操作的时候,网卡繁忙得不行,同时本地磁盘也没有闲着。
 
5,安装过程完成之后,需要两个节点各自以root身份运行一些小脚本:
 
到这块就没这么轻松了,其实在/opt/ora10g/oraInventory下执行orainstRoot.sh都没有问题,在RAC1下执行/opt/ora10g/product/10.2.0/crs_1下执行root.sh也没有问题,难就难在rac2下执行root.sh脚本,不知道是系统bug的问题还是什么,反正就不让你好好做完,怎样都会报错,最后还需要手工运行vipca来启动一些进程,根据君三思提供的解决方案,下面列出一个专题来进行说明。
查看全文
发表于:2009-01-04 ┆ 阅读(155)评论(0)

vmware+linux+oracle10g rac全过程(十四):clusterware安装_1

接下来是clusterware的安装

 

clusterware的安装在主节点上运行,所以我们接下来要做的是启动主节点RAC1,打开FTP功能,把clusterware软件传上去,然后以oracle用户的身份来执行整个安装过程,请看截图:


RAC1重启之后,第三块网卡意外的丢失了动态IP地址,这里临时赋予他一个静态IP地址,和之前的地址保持一样。

 


上传clusterware_linux32.zip安装介质后,以unzip命令对这个文件进行解压缩,解压完成之后得到clusterware这个文件夹。

 


将clusterware整个文件夹的属主和权限按照oracle用户的要求进行修改。

 


注销当前窗口,以oracle用户登陆,这样整个环境变量就挂靠在oracle户头下了。

 

 

在安装之前,通常要检查当前的环境,命令如下:

[oracle@rac1 cluvfy]$ /data/rhel5/clusterware/cluvfy/runcluvfy.sh stage -pre crsinst -n rac1,rac2 -verbose

在这个过程中,系统可能会报错,比如说什么包需要安装啊,swap区过小啊,这些东西统统不用管他们,跳过即可。这里说明一下,ORACLE有时候报的错莫名其妙,牛头不对马嘴,比如说前段时间我在HP环境下配置ORACLE RAC,在加载裸设备ocr的时候,系统报错说赋予ocr的权限和属主有问题,建议查清后再说。仔细检查之后,权限跟属主一点问题没有,结果是因为共享卷组没有激活导致,这想起来就很气人了,有这样忽悠群众的吗?所以ORACLE下的报错不必较真,就像这里一样,经过一番检查,他认为你试验环境没有达标,但你硬要往下做他也拿你没招,典型的吃硬不吃软。下面开始安装clusterware:

 

1,以oracle用户进入到clusterware目录,以不进行系统环境检查的机制运行runInstaller:


切记runInstaller后的-ignoreSysPreReqs关键字是必不可少的,因为默认redhat-5是不支持clusterware的安装的,我们必须过了这个山头才能安营扎寨。

 

2,稍微等上三、五秒钟,就能看到clusterware的安装界面,点击“next”:


 

3,根据我在oracle环境变量中的定义,系统默认将oraInventory目录安装到/opt/ora10g下,点击“next”:

查看全文
发表于:2009-01-04 ┆ 阅读(183)评论(0)

vmware+linux+oracle10g rac全过程(十三):故障处理过程
clusterware的配置在整个实验过程中是最为核心的步骤,而ASM磁盘的创建过程又是核心中的核心。如果这一步走对了,接下来就轻松很多。反之,如果这一步始终过不去,那不仅后面的实验没法进行,而且很打击人的积极性。我就在这一步踯躅了很长时间,因为所遭遇的故障久久无法解决,比如无法创建VOL1/VOL2的问题,比如在主节点上创建了VOL1/VOL2,但是在副节点上无法识别到的问题等等。还好,搜索引擎足够强大,很多问题我碰到的,人家也碰到了,而且也给出了解决方案,顺着一个个的解决方案总算是过了这一关,下面来具体探讨一下所遭遇的故障们。
 
1,同样的,为了跟前面的文章首尾呼应,这里先贴出一副图:
这幅图所透露出来的一个强烈的信息就是,裸设备文件和系统文件一定要隔离开,分别存放于不同的文件夹。为什么要这样做前面没有提,这里详细解释一下。我刚开始做实验的时候就是把系统文件跟裸设备文件全置放在一个文件夹内,到克隆操作系统的时候,这些文件也跟着一起到了副节点。到了创建共享磁盘的时候,潜伏的毒药就释放出来。比如我在RAC1上面创建了VOL1/VOL2,但是在RAC2上执行/etc/init.d/oracleasm scandisks后再执行/etc/init.d/oracleasm listdisks,没有任何显示,也就意味着在RAC2节点上识别不到RAC1节点上使用裸设备文件所创建的卷VOL1/VOL2。
 
造成这种现象的原因是此刻在RAC1和RAC2之间已经不存在任何联系,大家各自为政。在RAC1中存在实验所需裸设备文件,但是在系统克隆阶段,这些裸设备文件又随之涌入到了RAC2中,成了RAC2所独有的裸设备。举个简单的例子,政府规定低保户可以享受每月500圆人民币的补贴用来维持生活,甲因为家境贫困(没有裸设备),每月都靠政府发放的500圆人民币过日子。突然有一天,甲买福利彩票中了500万人民币(得到了裸设备),突然一跃成为富人阶级,那么他当然无权继续享受每月500圆的补贴了。
 
理解了这一点,就比较好解决了,按照之前给出的正确方法,将系统文件和裸设备文件隔离开,分别存放在不同的文件夹,这样系统克隆的时候就把裸设备文件排除在外。RAC1创建了VOL1/VOL2之后,RAC2再一扫描,就能够顺利的看到VOL1跟VOL2的身影了,这也就代表着共享磁盘创建成功。
 
2,针对另外一个问题再给出一幅图片:
这幅图前面已经单独给过一次,而且也就为什么这样做给出了详细的解释,这里再啰嗦一下。除去系统磁盘之外的四块磁盘不能在安装操作系统的时候捆绑在一起,否则后期磁盘分区的时候系统会提示你分区信息已经存在,如果你删去已经存在的分区再重新格式化磁盘并重新分区,在系统还没有重启的时候兴许感觉不出来,但只要系统一重启,就再也无法正常进入到系统了,因为作为系统一个组成部分遭到了毁灭性的破坏,系统也随之灰飞烟灭了。如果在没有重启的情况下,再使用这重新分区的磁盘来创建ASM磁盘,这时系统会认为这块盘还处于繁忙状态,并不是一块干净的磁盘,所以就无法创建可用的ASM磁盘。
碰到这样的问题,我还没有发现比较好的解决办法,唯有从头再来,这实在是一件让人痛苦不堪的事,这样的事,经历过一次也就够了。
 
3,在给出一张很有代表性的图片:
我看很多人在网上都贴出了类似这样的图片,问创建ASM磁盘不成功跟这个有没有关系,因为较之官方给出的配置过程不太一样,似乎少了些步骤:
Default user to own the driver interface []: oracle
Default group to own the driver interface []: dba
Start Oracle ASM library driver on boot (y/n) [n]: y
Fix permissions of Oracle ASM disks on boot (y/n) [y]: y
Writing Oracle ASM library driver configuration: [ OK ]
Loading module "oracleasm": [ OK ]
Mounting ASMlib driver filesystem: [ OK ]
Scanning system for ASM disks: [ OK ]
看到了吧,官方给出的配置过程和我实验中的配置过程还真不一样,乍看上去是少了一些步骤。很奇怪,我每次ASM磁盘配置过程都和我贴图上面一样,从来没有一次与官方这个配置雷同。在我还没有找到为什么不能创建ASM磁盘时我还真怀疑大概跟配置过程不完整有关系,也导致我一怒之下关了虚拟机,删去所有系统文件,从头来过(算上这一次,重装操作系统次数达到11次),但让人气馁非常的是到配置ASM磁盘的时候仍然和之前所显示一模一样。在我发现不能创建ASM磁盘的原因竟然跟安装操作系统时犯下的错误有关之后,我跳过这一步不去管它,继续创建VOL1跟VOL2,然后再RAC2节点上scandisks、listdisks,发现也能成功识别到VOL1跟VOL2,这说明我的配置也是没有问题的,虽然跟官方仍然存在那么一点点不同。
这段文字写完,希望所有对ASM磁盘配置过程心存疑虑的人们放心大胆的朝前迈,一点问题没有。
查看全文
发表于:2009-01-03 ┆ 阅读(179)评论(0)

阅读(1386) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~