服务器频繁死机,无法正常运行的问题往往就是系统崩溃问题,定位思路如图1所示。
图1 系统崩溃问题定位思路
- 配置kdump服务,使系统在崩溃时能收集崩溃信息,用于后续调试。
- 开启KASAN,使vmcore文件增加一些内存相关调试信息。
- 运行程序,若问题不复现,关闭KASAN,重新运行,复现问题。
- 若问题复现,重启服务器,确认vmcore文件生成。
- 使用Crash调试vmcore文件,定位问题原因。
- 分析问题原因,修改代码,验证。
- 若验证通过,则确认代码合入,问题解决。
- 若验证不通过,增加调试信息,重新编译,运行,复现问题。