定位思路

服务器频繁死机,无法正常运行的问题往往就是系统崩溃问题,定位思路如图1所示。

图1 系统崩溃问题定位思路
  1. 配置kdump服务,使系统在崩溃时能收集崩溃信息,用于后续调试。
  2. 开启KASAN,使vmcore文件增加一些内存相关调试信息。
  3. 运行程序,若问题不复现,关闭KASAN,重新运行,复现问题。
  4. 若问题复现,重启服务器,确认vmcore文件生成。
  5. 使用Crash调试vmcore文件,定位问题原因。
  6. 分析问题原因,修改代码,验证。
  7. 若验证通过,则确认代码合入,问题解决。
  8. 若验证不通过,增加调试信息,重新编译,运行,复现问题。