使用步骤
- 使用smartctl指令每天采集硬盘(包括正常盘与故障盘)SMART数据,并标记是否故障,并整理成指定格式的待训练数据文件fault_train.csv(详细可参见数据采集方法,输入文件格式)。fault_train.csv由fault列标记了是否故障盘。
- 导入BoostKit_KSML相关函数。
from BoostKit_KSML.hdd_fault_detect import fault_train from BoostKit_KSML.hdd_fault_detect import fault_update from BoostKit_KSML.hdd_fault_detect import fault_predict
- 调用fault_train接口,输入步骤1得出的待训练数据文件,得到一个二进制训练模型model.pkl。
fault_train(r"fault_train.csv", r"model.pkl")
- (可选)使用smartctl指令每天采集硬盘(包括正常盘与故障盘)SMART数据,并标记上是否故障,整理成指定格式的待增量训练数据文件fault_update.csv(详细可参见数据采集方法,输入文件格式),fault_update.csv由fault列标记了是否故障盘。
- (可选)调用fault_update接口,输入待增量训练数据文件fault_update.csv,增量训练已有的模型数据model.pkl,生成一个更新后的模型new_model.pkl。
fault_update(r"fault_update.csv", r"model.pkl", r"new_model.pkl")
- 使用smartctl指令每天采集待预测硬盘SMART数据,并整理成指定格式的待预测数据文件fault_predict.csv(详细可参见数据采集方法,输入文件格式),进行预测。fault_predict.csv为待预测数据集,未进行标注。
- 调用fault_predict接口,输入待预测数据文件fault_predict.csv与已有的模型数据model.pkl。文中以model.pkl举例进行说明,若执行了步骤4和步骤5,可将model.pkl替换成new_model.pkl。
fault_predict(r"fault_predict.csv", r"model.pkl")
接口日志将会通过子logger输出到log_file参数指定的文件中去(参数的详细信息可参见参数包)。但是logging模块直接配置并修改RootLogger,会导致所有子logger的日志输出全部向上传播到RootLogger并输出。
父主题: HDD故障预测