若ZooKeeper的leader节点的网卡出现网络拥塞,会导致其他follower节点与leader节点之间同步数据超时,从而被leader节点踢出,当被踢出的节点超过集群的一半以上时,会导致所有zkServer无法提供服务,可通过
下gcache.log日志文件判断。在follower节点上可看到如下日志。在leader节点上可看到如下日志。
该问题由于网络拥塞导致ZooKeeper Server之间同步数据的时延太高,事务超时。若leader服务器在syncLimit时间内无法获取到follower的心跳检测,则follower节点发生了网络IO错误,主动与leader断开连接,并主动shutdown导致。属于ZooKeeper原生处理。