鲲鹏社区首页
中文
注册
开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

冷更新故障如何恢复

在hinicadm3新增冷更新故障恢复开启功能,该能力默认关闭,推荐在开发调试时使用。命令详情,请参见《华为SP900 DPU卡 用户指南》中“升级微码子固件”。

  1. 更新用户固件开启冷更新故障恢复能力。
    hinicadm3 updatefw -i hinic0 -f Hinic3_flash.bin -a hot -t npu -sn  # 方式一
    hinicadm3 updatefw -i hinic0 -f Hinic3_flash.bin -a cold -n  # 方式二

    打印示例如下所示,表示更新成功。

    Please do not remove driver or network device.
    Loading...
    Firmware update start: 2025-05-24 00:40:52
    [>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>] [100%][\]
    Firmware update finish:2025-05-24 00:41:32
    Firmware update time used: 40s
    Loading firmware image succeed.
    Set update active cfg succeed!
    Please reboot OS to take firmware effect.
  2. 收集日志mpu_ram。
    打印示例如下所示,即为开启成功。
    Set recovery enable success.
  3. 冷更新后如出现故障(如SSH连接失败、找不到固件设备)时,首次故障发生后保持设备通电12分钟,完成上下电操作,重复上述上下电循环操作共计3次,第4次启动时系统将自动回退至备区固件。
    • 当ping目标设备超时,或SSH连接失败。
    • 当打印如下状态时,表示固件设备未找到。
      [root@localhost~]# hinicadm3 version -i hinic0
      Device name(hinic0) not exist.
      version command error(-6):Unknown device hinic0.
  4. 执行以下命令,关闭冷更新故障恢复能力。命令详情,请参见《华为SP900 DPU卡 用户指南》中“关闭故障恢复能力”。
    hinicadm3 recovery -i hinic0 -s disable

    打印示例如下所示,表示关闭成功。

    [root@localhost~]# hinicadm3 recovery -i hinic0 -s disable
    fw restore is disabled successfully.

三次上下电后,第四次重启后若设备仍无法被识别,建议卸载当前安装的SDK驱动rpm -e <driver-package-name>,按照原有的上下电操作流程,再次执行三次上下电操作,在第四次上下电后,参考《华为SP900 DPU卡 用户指南》中“安装软件”章节重新安装SDK驱动。