Oracle中Kill session的研究
作者:eygle |English Version 【转载时请以超链接形式标明文章出处和作者信息及本声明】
链接:
站内相关文章|Related Articles
三言两语 - 关于JOB Queue的文档摘要
MMAN - Oracle 10g的Memory manager进程
关于ocssd进程的三言两语
10g QMON Architecture及AQ_TM_PROCESSES
MMNL进程与ORA-07445 ktsmg_get_threshold
itpub link:
我们知道,在Oracle数据库中,可以通过kill session的方式来终止一个进程,其基本语法结构为:
alter system kill session 'sid,serial#' ;
被kill掉的session,状态会被标记为killed,Oracle会在该用户下一次touch时清除该进程.
我们发现当一个session被kill掉以后,该session的paddr被修改,如果有多个session被kill,那么多个
session
的paddr都被更改为相同的进程地址:
SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not
null;
SADDR SID SERIAL# PADDR USERNAME STATUS
-------- ---------- ---------- -------- ------------------------------ --------
542E0E6C 11 314 542B70E8 EYGLE INACTIVE
542E5044 18 662 542B6D38 SYS ACTIVE
SQL> alter system kill session '11,314';
System altered.
SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not
null;
SADDR SID SERIAL# PADDR USERNAME STATUS
-------- ---------- ---------- -------- ------------------------------ --------
542E0E6C 11 314 542D6BD4 EYGLE KILLED
542E5044 18 662 542B6D38 SYS ACTIVE
SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not
null;
SADDR SID SERIAL# PADDR USERNAME STATUS
-------- ---------- ---------- -------- ------------------------------ --------
542E0E6C 11 314 542D6BD4 EYGLE KILLED
542E2AA4 14 397 542B7498 EQSP INACTIVE
542E5044 18 662 542B6D38 SYS ACTIVE
SQL> alter system kill session '14,397';
System altered.
SQL> select saddr,sid,serial#,paddr,username,status from v$session where username is not
null;
SADDR SID SERIAL# PADDR USERNAME STATUS
-------- ---------- ---------- -------- ------------------------------ --------
542E0E6C 11 314 542D6BD4 EYGLE KILLED
542E2AA4 14 397 542D6BD4 EQSP KILLED
542E5044 18 662 542B6D38 SYS ACTIVE
在这种情况下,很多时候,资源是无法释放的,我们需要查询spid,在操作系统级来kill这些进程.
但是由于此时v$session.paddr已经改变,我们无法通过v$session和v$process关联来获得spid
那还可以怎么办呢?
我们来看一下下面的查询:
SQL> SELECT s.username,s.status,
2 x.ADDR,x.KSLLAPSC,x.KSLLAPSN,x.KSLLASPO,x.KSLLID1R,x.KSLLRTYP,
3 decode(bitand (x.ksuprflg,2),0,null,1)
4 FROM x$ksupr x,v$session s
5 WHERE s.paddr(+)=x.addr
6 and bitand(ksspaflg,1)!=0;
USERNAME STATUS ADDR KSLLAPSC KSLLAPSN KSLLASPO
KSLLID1R KS D
------------------------------ -------- -------- ---------- ---------- ------------ -------
--- -- -
542B44A8 0 0
0
ACTIVE 542B4858 1 14 24069
0 1
ACTIVE 542B4C08 26 16 15901
0 1
ACTIVE 542B4FB8 7 46 24083
0 1
ACTIVE 542B5368 12 15 24081
0 1
ACTIVE 542B5718 15 46 24083
0 1
ACTIVE 542B5AC8 79 4 15923
0 1
ACTIVE 542B5E78 50 16 24085
0 1
ACTIVE 542B6228 754 15 24081
0 1
ACTIVE 542B65D8 1 14 24069
0 1
ACTIVE 542B6988 2 30 14571
0 1
USERNAME STATUS ADDR KSLLAPSC KSLLAPSN KSLLASPO
KSLLID1R KS D
------------------------------ -------- -------- ---------- ---------- ------------ -------
--- -- -
SYS ACTIVE 542B6D38 2 8 24071
0
542B70E8 1 15 24081
195 EV
542B7498 1 15 24081
195 EV
SYS INACTIVE 542B7848 0 0
0
SYS INACTIVE 542B7BF8 1 15 24081
195 EV
16 rows selected.
我们注意,红字标出的部分就是被Kill掉的进程的进程地址.
简化一点,其实就是如下概念:
SQL> select p.addr from v$process p where pid <> 1 2 minus 3 select s.paddr from
v$session s;ADDR
--------
542B70E8
542B7498
Ok,现在我们获得了进程地址,就可以在v$process中找到spid,然后可以使用Kill或者orakill在系统级
来杀掉这些进程.
实际上,我猜测:
当在Oracle中kill session以后, Oracle只是简单的把相关session的paddr 指向同一个虚拟地址.
此时v$process和v$session失去关联,进程就此中断.
然后Oracle就等待PMON去清除这些Session.所以通常等待一个被标记为Killed的Session退出需要花费很
长的时间.
如果此时被Kill的process,重新尝试执行任务,那么马上会收到进程中断的提示,process退出,此时
Oracle会立即启动PMON
来清除该session.这被作为一次异常中断处理.
-The End-
一、问题的提出
很多的时候我们迅速的杀掉Oralcle的一些session,理由大体如下:
1、 一些时候,由于我们的数据量很大,相应的事务大并且多,在做shutdown immediate的时候会花费
好多的时间,而我们却想用shutdown immediate的方式,而又要把数据库迅速的shutdown下来。
2、 我们的应用可能使用了会话控制,即在应用的层面控制了一些用户的连接的数量。但有时可能网络
发生的瞬断,从而就产生了一些死进程,他们的状态为Inactive的状态。当我们用alter system kill
session ‘sid,serial#’进行清除时,这些session的状态又变成了killed,这些就由Pmon进程来慢慢进
行清除了,而你恰恰又是个急脾气。
3、 系统忽然慢了现来,你发现是某个session在做怪,想迅速把它迅速结束掉。
二、处理方法
其实处理方法很简单,是被一些人称为“谋杀”的一种方法。因为一个session会对应着操作系统中相应
的一个进程(process),我们不使用Alter system kill session这种方式了,取而代之则是kill的方式,
当session的后台进程被杀掉了,便会促使懒散的Pmon进程迅速进行清理工作。
1、 以一个session做以示例,
a、 找到你要杀掉的那个session, 并记下paddr
b、 找到这个session所对应的spid
c、 杀掉spid所标识的那个进程
如果你的Oracle是在Unix平台上的,可以用kill。
$kill 13824
如果你的Oracle是在windown平台上的,有一些的不同,因为windown是以thead来代替process的,需要用
到sid和spid两个值,所用的命令也由kill替换为Orakill,格式为:orakill sid spid
C:\>orakill 941 13824
d、 再查一下v$session,看会话在不在了。
2、 如何谋杀掉所有的Oracle的用户的进程呢?
a、 windows的环境,执行如下图中的SQL,并把结果存成.bat的文件,比如kill.bat, 执行一下kill.bat
就可以了。
b、 Unix的环境相对来说就简单多了,执行如下的命令就可以了
$ ps -ef|grep $ORACLE_SID|grep -v ora_|grep LOCAL=NO|awk '{print $2}'|xargs kill
然后你再shutdown immediate就很快的了。