To be a better coder
分类: LINUX
2021-08-10 17:43:31
业务运行过程中,Linux系统僵死,屏幕无任何有效打印信息,网络中断、键盘鼠标没有任何响应。这种故障现象,可能是因为Linux内核死锁导致。由于无任何有效打印信息,内核日志中也没有记录,就无法定位故障根因。
https: //e-mailky.github.io/2017-01-18-kernel-daedlock-check
https: //blog.csdn.net/wangquan1992/article/details/115146404
如何让Linux内核在僵死前打印相关信息,对问题定位尤为关键。其中一个有效手段是打开“Kernel Hacking”选项,然后重新编译内核。
对于Linux内核死锁有帮助的几个配置选项有:
[*] Detect Soft Lockups
[ ] Panic (Reboot) On Soft Lockups
[*] Detect Hung Tasks
(120) Default timeout for hung task detection (in seconds)
[*] Panic (Reboot) On Hung Tasks
[ ] Lock usage statistics
[ ] Spinlock debugging: sleep-inside-spinlock checking