鲲鹏社区首页
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助

SP900网口故障

故障现象

处理步骤

快速恢复方法

网口不通

  1. 使用lspci命令排查DPU卡是否识别正常。
  2. 排查网线是否连接正常。
  3. 通过串口登录SP900,收集日志。
  4. 在Linux系统中执行以下命令:ifconfig ethN,ethtool ethN,排查网卡是否up,且状态正常link,IP是否设置正确网口上(不同操作系统排查命令不同,请根据实际操作系统排查)。
  5. 在SP900的操作系统中执行以下命令:ethtool -p ethN,排查网口配置文件和物理网口是否一致,网口状态灯亮,对端交换机网口up。
  6. 排查IP,网关,VLAN,bonding及上行交换机网口设置。

ping同网段其他IP,并检查同网段其他服务器是否存在网络异常:

  • 如果同网段多台服务器有问题,则检查外部交换网络是否异常。
  • 如果同网段只有一台服务器有问题:
    • 检查网卡网口状态(状态指示灯是否常亮):如果网口指示灯是link down(状态指示灯灭),将异常网口对应的光模块、光纤和上行交换机端口与正常网口对应部件进行互换,验证是否正常,最后根据实际情况更换或调整部件。
    • 如果问题跟随SP900出现,请在业务允许停机的情况下重启网络服务,观察是否恢复正常。如果没有恢复正常,请先下电后上电观察是否解决,否则更换网卡。

网口丢包/错包

  1. 收集日志。
  2. 排查网口丢包/错包统计是否持续增长,非持续增长的统计可不关注。
  3. 排查网口对调网线测试,是否和网线相关。
  4. 在Linux系统中执行ethtool -S ethN命令查看接收和发送的数据包数量、错误数量等(不同操作系统排查命令不同,请根据实际操作系统排查)。
  • 排查是否丢包:执行ethtool -S ethN命令查询丢包类型,执行top命令检查系统资源情况(如软中断,CPU和内存占用情况)。
  • 检查网卡流量:在业务允许停机的情况下,首先用PC直连网口,测试网卡流量。然后在和其他正常网口进行交叉验证,排查光模块、光纤线、上行交换机端口,验证是否丢包,最后根据实际情况更换或调整部件。
  • 如果问题跟随SP900出现,请在业务允许停机的情况下重启网络服务,观察是否恢复正常。如果没有恢复正常,请先下电后上电观察是否解决,否则更换网卡。