S920X20服务器升级固件版本后BMC上报前置硬盘背板缺失问题案例分析
发表于 2026/06/26
0
1 问题现象描述
硬件配置
- 型号:S920X20服务器
- 配置:SDI卡配置
问题背景
SDI卡断链,SDI卡上报UCE,主机被下电。CPLD固件版本为5.13。
问题现象
升级了CPLD固件版本到6.13,配套升级了其他固件版本后BMC上报前置硬盘背板缺失(The front disk backplane is absent.)告警。
---
2 关键过程与根因分析
关键过程
Step 1:事件时间线
2025-12-08 17:01:17 SDI卡发生了断连(Surprise Down Error)
2025-12-08 17:01:28 SDI V5.0 triggered an uncorrectable error后
2025-12-08 17:02:40 整机被下电

Step 2:固件升级建议
当前固件版本信息:CPLD 5.13较低,建议升级CPLD固件版本到6.13,配套升级其他固件版本到基线。

Step 3:问题出现
升级了固件版本上电后BMC上报前置硬盘背板缺失告警。

告警可能的原因:

建议机房检查下前置硬盘背板的电源线缆、低速信号线缆

Step 4:排查验证
机房反馈该设备上没有前置硬盘背板组件。AC上下电设备后仍未恢复。


Step 5:PSR版本定位
对于无背板配置的服务器,要升级BC83RCIAF的PSR版本。但历史升级的PSR版本为S920X20-BC83RCIA-PSR_3.44.hpm(有线缆背板版本)。

查看历史升级的PSR版本:S920X20-BC83RCIA-PSR_3.44.hpm

Step 6:修复验证
重新升级PSR固件版本为S920X20-BC83RCIAF-PSR_3.44.hpm,升级后重启BMC,告警消除。

根因分析
升级固件是未查看是否有前置硬盘背板组件,升级了PSR固件为S920X20-BC83RCIA-PSR_3.44.hpm导致BMC上报前置硬盘背板不识别,重新升级PSR固件为S920X20-BC83RCIAF-PSR_3.44.hpm后BMC告警消除
3 结论、解决方案及效果
结论
升级固件时未根据实际配置选择正确的PSR版本,错误升级了有背板版本的PSR固件,导致BMC误报前置硬盘背板缺失。
解决方案
升级正确的PSR固件版本:S920X20-BC83RCIAF-PSR_3.44.hpm
效果
升级正确版本后BMC告警消除。
4 经验总结与预防措施
经验总结
S920X20服务器有两种PSR固件版本:有前置硬盘背板(BC83RCIA)和无前置硬盘背板(BC83RCIAF)
升级PSR固件前必须确认服务器是否配置了前置硬盘背板
错误升级不匹配的PSR固件会导致BMC告警
预防措施
升级PSR固件前先确认服务器配置
根据实际配置选择对应版本的PSR固件


