分类:
2008-10-27 14:28:02
从昨天开始,正式全程参与某客户的数据库系统升级工作。工作内容是将客户的关键应用从原先的9.2.0.6单实例升级为 10.2.0.3 双实例RAC。
更加详细的工作内容包括:
1. 将原先在JFS2文件系统上的文件转移到GPFS中
2. 将原先单实例模式的Shareplex转换为RAC模式的Shareplex
3. 将原先的高级复制转换为简单的物化视图刷新
4. 使用Oracle Clusterware替代HACMP负责Shareplex资源的切换
总的来说,是一个很大的工程,数据库大小在800G左右,升级使用DBUA,单实例转换为RAC则使用rconfig实用程序。
工作的几个难点在于:
1. DBUA是否能顺利将Oracle 9.2.0.6升级为Oracle 10.2.0.3?
2. rconfig是否能顺利将单实例数据库转换为RAC数据库?
3. 能否正常在Oracle Clusterware中添加Shareplex资源并且保证在各种异常情况下顺利切换到另外一台主机上?
之前已经做过多次,希望这两天的正式升级会一帆风顺。
升级工作圆满结束,有惊无险
1. 本来一直到rconfig转换单实例到RAC之前,整个进度都是提前了4个小时左右的,敲完rconfig的命令之后大家欢欣鼓舞地去开会,结果开完会回来发现rconfig失败了,一直处于悬停状态,整个主机没有任何负载,数据库实例也完全无法登录。根据回退方案将数据库重新转换为之前的单实例模式,成功启动完数据库以后,开始检查转换为RAC失败的原因。最后发现是ntp服务配置有问题,RAC两个节点的时间差异在1小时。重新调整ntp服务,然后再次转换,成功结束。此时,落后进度计划大概1个小时。
2. 后续的工作一帆风顺,应用上的几个问题也相继迅速地修改了,上线当天上午观察了一下主机情况,一切正常。于是中午就离开客户处了,没过2小时,客户电话说,机房忽然断电,所有设备全部意外down机 。。。我问UPS呢?客户说,就是一台UPS短路导致机房断电的。我FT。再赶回客户处,等着加电,幻想着加电以后GPFS文件系统全部损坏,然后再从带库恢复数据的凄惨景象。幸运的是,加电以后全部设备都安然启动,数据库也正常。Shareplex丢失了一部分数据,也都成功恢复。
3. 到今天为止没有更点儿背的事情发生,应用完全正常,宣告这次升级工作圆满结束。