使用步骤
- 使用smartctl指令每天采集硬盘(包括正常盘与故障盘)SMART数据,并标记是否故障,并整理成指定格式的待训练数据文件fault_train.csv(详细可参见数据采集方法,输入文件格式)。fault_train.csv由fault列标记了是否故障盘。
- 导入BoostKit_KSML相关函数。
from BoostKit_KSML.ssd_fault_detect import fault_train from BoostKit_KSML.ssd_fault_detect import fault_update from BoostKit_KSML.ssd_fault_detect import fault_predict
- 调用fault_train接口,输入步骤1得出的待训练数据文件,得到一个二进制训练模型model.pkl。
fault_train(r'fault_train.csv', r'model.pkl')
- 可选:(可选)使用smartctl指令每天采集硬盘(包括正常盘与故障盘)SMART数据,并标记上是否故障,并整理成指定格式的待增量训练数据文件fault_update.csv(详细可参见数据采集方法,输入文件格式),fault_update.csv由fault列标记了是否故障盘。
- 调用fault_update接口,输入待增量训练数据文件fault_update.csv,增量训练已有的模型数据model.pkl(可选),生成一个更新后的模型new_model.pkl。
fault_update(r'fault_update.csv', r'model.pkl', r'new_model.pkl')
- 使用smartctl指令每天采集待预测硬盘SMART数据,并整理成指定格式的待预测数据文件fault_predict.csv(详细可参见数据采集方法,输入文件格式),进行预测。fault_predict.csv为待预测数据集,未进行标注。
- 调用fault_predict接口,输入待预测数据文件fault_predict.csv与已有的模型数据model.pkl。
fault_predict(r'fault_test.data', r'model.pkl')
接口日志将会通过子logger输出到log_file参数指定的文件中去(参数信息详见参数包)。但是logging模块直接配置并修改RootLogger,会导致所有子logger的日志输出全部向上传播到RootLogger并输出。