我要评分文档获取效率文档正确性内容完整性文档易理解0/200提交在线提单论坛求助 HDFS NameNode自动停止的解决方法 问题现象描述 执行脚本后HDFS NameNode自动停止。 关键过程、根本原因分析 查看日志,发现Hive提示堆内存溢出,HDFS提示NameNode连接超时导致停止运行等信息。 查看NameNode机器环境。lscpu 查看负载。top 分析到系统numa个数只有2个以及网络中断很高,怀疑网卡版本有问题。 查看网卡版本。ethtool -i enp4s0 发现是1822网卡,驱动未升级。 排查集群机器。 结论、解决方案及效果 升级网卡驱动。升级后的网卡。 关闭DIE交织。关闭DIE交织后,正常显示4个numa。 再次执行脚本。NameNode正常,distcp任务运行时间由2个多小时降低至3分钟左右。 父主题: 其他