开发者
资源
S920X20服务器升级固件版本后BMC上报前置硬盘背板缺失问题案例分析

S920X20服务器升级固件版本后BMC上报前置硬盘背板缺失问题案例分析

案例分享鲲鹏硬件

发表于 2026/06/26

0


1 问题现象描述

硬件配置

- 型号:S920X20服务器

- 配置:SDI卡配置

问题背景

SDI卡断链,SDI卡上报UCE,主机被下电。CPLD固件版本为5.13。

问题现象

升级了CPLD固件版本到6.13,配套升级了其他固件版本后BMC上报前置硬盘背板缺失(The front disk backplane is absent.)告警。

---

2 关键过程与根因分析

关键过程

Step 1:事件时间线

2025-12-08 17:01:17 SDI卡发生了断连(Surprise Down Error)
2025-12-08 17:01:28 SDI V5.0 triggered an uncorrectable error后
2025-12-08 17:02:40 整机被下电

Step 2:固件升级建议

当前固件版本信息:CPLD 5.13较低,建议升级CPLD固件版本到6.13,配套升级其他固件版本到基线。

Step 3:问题出现

升级了固件版本上电后BMC上报前置硬盘背板缺失告警。

告警可能的原因:

建议机房检查下前置硬盘背板的电源线缆、低速信号线缆

Step 4:排查验证

机房反馈该设备上没有前置硬盘背板组件。AC上下电设备后仍未恢复。

Step 5:PSR版本定位

对于无背板配置的服务器,要升级BC83RCIAF的PSR版本。但历史升级的PSR版本为S920X20-BC83RCIA-PSR_3.44.hpm(有线缆背板版本)。

查看历史升级的PSR版本:S920X20-BC83RCIA-PSR_3.44.hpm

Step 6:修复验证

重新升级PSR固件版本为S920X20-BC83RCIAF-PSR_3.44.hpm,升级后重启BMC,告警消除。

根因分析

升级固件是未查看是否有前置硬盘背板组件,升级了PSR固件为S920X20-BC83RCIA-PSR_3.44.hpm导致BMC上报前置硬盘背板不识别,重新升级PSR固件为S920X20-BC83RCIAF-PSR_3.44.hpmBMC告警消除

3 结论、解决方案及效果

结论

升级固件时未根据实际配置选择正确的PSR版本,错误升级了有背板版本的PSR固件,导致BMC误报前置硬盘背板缺失。

解决方案

升级正确的PSR固件版本:S920X20-BC83RCIAF-PSR_3.44.hpm

效果

升级正确版本后BMC告警消除。

4 经验总结与预防措施

经验总结

S920X20服务器有两种PSR固件版本:有前置硬盘背板(BC83RCIA)和无前置硬盘背板(BC83RCIAF)

升级PSR固件前必须确认服务器是否配置了前置硬盘背板

错误升级不匹配的PSR固件会导致BMC告警

预防措施

升级PSR固件前先确认服务器配置

根据实际配置选择对应版本的PSR固件


本页内容