ORA-01102: cannot mount database in EXCLUSIVE mode-superior

今天在STARTUP一数据库时，发生如下错误：

SQL> conn /as sysdba
Connected to an idle instance.
SQL> startup
instance started.

Total System Global Area 276824064 bytes
Fixed Size 778736 bytes
Variable Size 137371152 bytes
Database Buffers 138412032 bytes
Redo Buffers 262144 bytes
ORA-01102: cannot mount database in EXCLUSIVE mode

SQL> shutdown immediate
ORA-01507: database not mounted

instance shut down.

GOOGLE一下，发现是lk文件造成的，该文件位于ORALCE_HOME下的dbs目录下，马上检查该文件：

[root@qa- dbs]# fuser -u lkNDMSQA
lkNDMSQA: 6666( ) 6668( ) 6670( ) 6672( ) 6674( ) 6676( ) 6678( ) 6680( ) 6690( ) 6692( ) 6694( ) 6696( ) 6737( ) 6830( )

果然该文件没释放，用fuser命令kill掉：

[root@qa- dbs]# fuser -k lkNDMSQA
lkNDMSQA: 6666 6668 6670 6672 6674 6676 6678 6680 6690 6692 6694 6696 6737 6830
[root@qa- dbs]# fuser -u lkNDMSQA

然后：

SQL> startup
instance started.

Total System Global Area 276824064 bytes
Fixed Size 778736 bytes
Variable Size 137371152 bytes
Database Buffers 138412032 bytes
Redo Buffers 262144 bytes
Database mounted.
Database opened.
SQL>

数据库成功OPEN.

关于该错误更详细的介绍如下：原文链接：

数据库异常关闭后无法启动问题处理一例

作者： fuyuncat

来源：

某系统突然掉电，系统启动后发现无法启动。启动时报如下错误：

ORA-01102 cannot mount database in EXCLUSIVE mode
出现1102错误可能有以下几种可能：

一、在HA系统中，已经有其他节点启动了实例，将双机共享的资源（如磁盘阵列上的裸设备）占用了；

二、说明被异常关闭时，有资源没有被释放，一般有以下几种可能，

1、的共享内存段或信号量没有被释放；

2、的后台进程（如SMON、PMON、DBWn等）没有被关闭；

3、用于锁内存的文件lk和sgadef.dbf文件没有被删除。

首先，虽然我们的系统是HA系统，但是备节点的实例始终处在关闭状态，这点通过在备节点上查数据库状态可以证实。

其次、是因系统掉电引起数据库宕机的，系统在接电后被重启，因此我们排除了第二种可能种的1、2点。最可疑的就是第3点了。

查$ORACLE_HOME/dbs目录：

$ cd $ORACLE_HOME/dbs
$ ls sgadef*
sgadef* not found
$ ls lk*
lkORA92
果然，lk文件没有被删除。将它删除掉

$ rm lk*
再启动数据库，成功。

如果怀疑是共享内存没有被释放，可以用以下命令查看：

$ipcs -mop
IPC status from /dev/kmem as of Thu Jul 6 14:41:43 2006
T ID KEY MODE OWNER GROUP NATTCH CPID LPID
Shared Memory:
m 0 0×411c29d6 –rw-rw-rw- root root 0 899 899
m 1 0×4e0c0002 –rw-rw-rw- root root 2 899 901
m 2 0×4120007a –rw-rw-rw- root root 2 899 901
m 458755 0×0c6629c9 –rw-r—– root sys 2 9113 17065
m 4 0×06347849 –rw-rw-rw- root root 1 1661 9150
m 65541 0xffffffff –rw-r–r– root root 0 1659 1659
m 524294 0×5e100011 –rw——- root root 1 1811 1811
m 851975 0×5fe48aa4 –rw-r—– oinstall 66 2017 25076
然后它ID号清除共享内存段：

$ipcrm –m 851975
对于信号量，可以用以下命令查看：

$ ipcs -sop
IPC status from /dev/kmem as of Thu Jul 6 14:44:16 2006
T ID KEY MODE OWNER GROUP
Semaphores:
s 0 0×4f1c0139 –ra——- root root
… …
s 14 0×6c200ad8 –ra-ra-ra- root root
s 15 0×6d200ad8 –ra-ra-ra- root root
s 16 0×6f200ad8 –ra-ra-ra- root root
s 17 0xffffffff –ra-r–r– root root
s 18 0×410c05c7 –ra-ra-ra- root root
s 19 0×00446f6e –ra-r–r– root root
s 20 0×00446f6d –ra-r–r– root root
s 21 0×00000001 –ra-ra-ra- root root
s 45078 0×67e72b58 –ra-r—– oinstall
根据信号量ID，用以下命令清除信号量：

$ipcrm -s 45078
如果是进程没有关闭，用以下命令查出存在的进程：

$ ps -ef|grep ora
29976 1 0 Jun 22 ? 0:52 ora_dbw0_ora92
29978 1 0 Jun 22 ? 0:51 ora_dbw1_ora92
5128 1 0 Jul 5 ? 0:00 oracleora92 (LOCAL=NO)
… …
然后用kill -9命令杀掉进程

$kill -9
总结：

当发生1102错误时，可以按照以下流程检查、排错：

1.如果是HA系统，检查其他节点是否已经启动实例；
2.检查进程是否存在，如果存在则杀掉进程；
3.检查信号量是否存在，如果存在，则清除信号量；
4.检查共享内存段是否存在，如果存在，则清除共享内存段；
5.检查锁内存文件lk和sgadef.dbf是否存在，如果存在，则删除。