今天编写的两条极具杀伤力的命令,它可以瞬间将Oracle杀死在无形之中。后面我将给出简单注释并展示一下它的威力。
$ ps -ef |grep $Oracle_SID|grep -v grep|awk '{print $2}' | xargskill-9
$ ipcs -m | grep Oracle | awk '{print $2}' | xargs ipcrm shm
-
这两条命令的来由:
今天处理了三起Oracle数据库无故无法登录的问题,无论你采取什么手段都无法登陆到Oracle的SQL*PLus中,更谈不上故障排查了。
这种情况下有两种选择,第一种选择是经过一个较长的时间来排查故障原因,另外一种方法是不惜一切代价启动数据库以便尽快恢复生产。
如果是测试实验环境可以使用第一种方法来完成,对于排查问题的经验积累是有意的。
如果是生产环境,减少停机时间是最最至上的原则,所以我们只有不惜一切代价让数据库尽快恢复使用。
对于尽快恢复生产的方法主要也有两种。
第一种不惜代价的方法是重启服务器主机,彻底释放一切资源,重新来过,这种方法是有效的,不过停机时间还是有点长,而且技术含量比较低,所以不是很推荐使用这种超级“简单粗暴”的方法。
第二种方法就是我将要给大家展示的方法。
1.第一步:使用Linux的kill命令杀死所有与Oracle有关的进程。
1)查询到与Oracle_SID相关的oracle进程
$ ps -ef |grep $Oracle_SID
Oracle 7776 1 0 22:51 ? 00:00:00 ora_pmon_ora10g
Oracle 7778 1 0 22:51 ? 00:00:00 ora_psp0_ora10g
Oracle 7780 1 0 22:51 ? 00:00:00 ora_mman_ora10g
Oracle 7782 1 0 22:51 ? 00:00:00 ora_dbw0_ora10g
Oracle 7784 1 0 22:51 ? 00:00:00 ora_dbw1_ora10g
Oracle 7786 1 0 22:51 ? 00:00:00 ora_lgwr_ora10g
Oracle 7788 1 0 22:51 ? 00:00:00 ora_ckpt_ora10g
Oracle 7790 1 0 22:51 ? 00:00:00 ora_smon_ora10g
Oracle 7792 1 0 22:51 ? 00:00:00 ora_reco_ora10g
Oracle 7794 1 0 22:51 ? 00:00:00 ora_cjq0_ora10g
Oracle 7796 1 0 22:51 ? 00:00:00 ora_mmon_ora10g
Oracle 7798 1 0 22:51 ? 00:00:00 ora_mmnl_ora10g
Oracle 7832 1 0 22:51 ? 00:00:00 ora_arc0_ora10g
Oracle 7834 1 0 22:51 ? 00:00:00 ora_arc1_ora10g
Oracle 7836 1 0 22:51 ? 00:00:00 ora_qmnc_ora10g
Oracle 7842 1 0 22:51 ? 00:00:00 ora_q000_ora10g
Oracle 7847 1 0 22:52 ? 00:00:00 ora_q001_ora10g
Oracle 7951 7592 0 23:11 pts/2 00:00:00 grep ora10g
2)去除掉包含grep命令本身的记录
$ ps -ef |grep $Oracle_SID |grep -v grep
Oracle 7776 1 0 22:51 ? 00:00:00 ora_pmon_ora10g
Oracle 7778 1 0 22:51 ? 00:00:00 ora_psp0_ora10g
Oracle 7780 1 0 22:51 ? 00:00:00 ora_mman_ora10g
Oracle 7782 1 0 22:51 ? 00:00:00 ora_dbw0_ora10g
Oracle 7784 1 0 22:51 ? 00:00:00 ora_dbw1_ora10g
Oracle 7786 1 0 22:51 ? 00:00:00 ora_lgwr_ora10g
Oracle 7788 1 0 22:51 ? 00:00:00 ora_ckpt_ora10g
Oracle 7790 1 0 22:51 ? 00:00:00 ora_smon_ora10g
Oracle 7792 1 0 22:51 ? 00:00:00 ora_reco_ora10g
Oracle 7794 1 0 22:51 ? 00:00:00 ora_cjq0_ora10g
Oracle 7796 1 0 22:51 ? 00:00:00 ora_mmon_ora10g
Oracle 7798 1 0 22:51 ? 00:00:00 ora_mmnl_ora10g
Oracle 7832 1 0 22:51 ? 00:00:00 ora_arc0_ora10g
Oracle 7834 1 0 22:51 ? 00:00:00 ora_arc1_ora10g
Oracle 7836 1 0 22:51 ? 00:00:00 ora_qmnc_ora10g
Oracle 7842 1 0 22:51 ? 00:00:00 ora_q000_ora10g
Oracle 7847 1 0 22:52 ? 00:00:00 ora_q001_ora10g
3)使用awk命令得到我们关心的进程号
$ ps -ef |grep $Oracle_SID |grep -v grep|awk '{print $2}'
7776
7778
7780
7782
7784
7786
7788
7790
7792
7794
7796
7798
7832
7834
7836
7842
7847
4)万事俱备,我们最后使用kill命令将Oracle的进程杀死,因此得到了下面完整的命令
$ ps -ef |grep $Oracle_SID |grep -v grep|awk '{print $2}' | xargs kill -9
2.第二步:使用Linux的ipcs和ipcsrm命令释放Oracle占用的共享内存。
1)使用ipcs命令查看系统中共享内存使用情况
$ ipcs -m
------ Shared Memory Segments --------
key shmid owner perms bytes nattch status
0x00000000 32768 root 644 72 2 dest
0x00000000 65537 root 644 16384 2 dest
0x00000000 98306 root 644 280 2 dest
0x00000000 131075 root 644 790528 2 dest
0x00000000 163844 root 644 790528 2 dest
0x00000000 196613 root 644 790528 2 dest
0x00000000 327689 Oracle 644 790528 2 dest
0x00000000 360458 Oracle 644 790528 2 dest
0x00000000 393227 Oracle 644 790528 2 dest
0xecc5fba0 786447 Oracle 640 5370806272 30
2)使用grep命令过滤后得到与Oracle相关的内容
$ ipcs -m | grep Oracle
0x00000000 327689 Oracle 644 790528 2 dest
0x00000000 360458 Oracle 644 790528 2 dest
0x00000000 393227 Oracle 644 790528 2 dest
0xecc5fba0 786447 Oracle 640 5370806272 31
2)使用awk命令获得上面我们关心的shmid字段内容
$ $ ipcs -m | grep Oracle | awk '{print $2}'
327689
360458
393227
786447
3)最后使用ipcsrm命令释放共享内存
$ ipcs -m | grep Oracle | awk '{print $2}' | xargs ipcrm shm
resource(s) deleted
再次查看一下,此时共享内存已经被释放。
$ ipcs -m | grep Oracle
0x00000000 327689 Oracle 644 790528 2 dest
0x00000000 360458 Oracle 644 790528 2 dest
0x00000000 393227 Oracle 644 790528 2 dest
0x00000000 786447 Oracle 640 5370806272 31 dest
3.此时,我们便可以登录到数据库,最后启动数据库恢复生产。
4.小结
这种方法相对也是比较“粗暴”的。不过在危难之时还是可以派上用场。
重点强调:
手工杀掉Oracle进程和手工释放共享内存是非常危险的,不到万不得已,千万不要使用;
这里我给出的两条极具杀伤力的命令,请不要轻易尝试。
Good luck.
本文出自:亿恩科技【www.enkj.com】
服务器租用/服务器托管中国五强!虚拟主机域名注册顶级提供商!15年品质保障!--亿恩科技[ENKJ.COM]
|