鲲鹏社区首页
EN
注册
开发者
我要评分
获取效率
正确性
完整性
易理解
在线提单
论坛求助

冷更新故障恢复

在hinicadm3新增冷更新故障恢复开启功能,该能力默认关闭,推荐在开发调试时使用。

接口名称

hinicadm3 recovery -i <device_id> -s disable

接口描述

关闭故障恢复功能。

参数说明

参数名

入参/出参

说明

device_id

入参

设备ID。

使用示例

hinicadm3 recovery -i hinic0 -s disable

参数有效性规格

表1 入参说明

参数

说明

-h, --help

显示帮助信息并退出程序,无参数值。

-i <device_id>

该参数为设备名,如hinic0,必选。

-s <disable>

该参数为状态设置,必选,且必须为disable。

冷更新故障恢复操作步骤

  1. 更新用户固件开启冷更新故障恢复能力。
    hinicadm3 updatefw -i hinic0 -f Hinic3_flash.bin -a hot -t npu -sn  或 hinicadm3 updatefw -i hinic0 -f Hinic3_flash.bin -a cold -n

    打印示例如下所示,表示更新成功。

    Please do not remove driver or network device.
    Loading...
    Firmware update start: 2025-05-24 00:40:52
    [>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>] [100%][\]
    Firmware update finish:2025-05-24 00:41:32
    Firmware update time used: 40s
    Loading firmware image succeed.
    Set update active cfg succeed!
    Please reboot OS to take firmware effect.
  2. 收集日志mpu_ram。
    打印示例如下所示,即为开启成功。
    Set recovery enable success.
  3. 冷更新后如出现故障(如SSH连接失败、找不到固件设备)时,首次故障发生后保持设备通电12分钟,执行一次上下电操作,重复上述上下电循环操作共计3次,第4次启动时系统将自动回退至备区固件。
    • 当ping目标设备超时,或SSH连接失败。
    • 当打印如下状态时,即为找不到固件设备。
      [root@localhost~]# hinicadm3 version -i hinic0
      Device name(hinic0) not exist.
      version command error(-6):Unknown device hinic0.
  4. 执行以下命令,关闭冷更新故障恢复能力。
    hinicadm3 recovery -i hinic0 -s disable

    打印示例如下所示,表示关闭成功。

    [root@localhost~]# hinicadm3 recovery -i hinic0 -s disable
    fw restore is disabled successfully.