介绍
在分布式存储系统中一般存在多个节点,每个节点上存在多块硬盘,通过对逻辑数据的拆分,多个硬盘共同参与数据的存储。在分布式存储系统的每个设备上一般存在多块硬盘,由于坏道和外界环境的原因,不同硬盘之间处理IO请求的时长可能存在差异,导致对IO请求响应过慢,严重的时候可能导致业务中断影响整个集群的性能。因此通过在业务运行的时候提前检测出慢盘,通过业务隔离能够显著降低集群的长尾时延和集群性能的稳定性。通过采集系统磁盘的w_await完成通过慢盘检测算法对磁盘数据的异常数据识别和计算确认磁盘状态。
图1 HDD/SSD慢盘检测工作流程图片
父主题: HDD/SSD慢盘检测