ES failed shard on node[XXX]: failed recovery, failure RecoveryFailedException XXX Too many openfile
今天集群挂掉了,状态一直是red,恢复节点之后,开始恢复分片数据,一直都很慢。
直到所有分片都停止分配,但是此时集群状态还是red。
原因是:某节点上的分片尝试恢复5次没有成功,然后就丢弃不管。导致该分片无法恢复。
解决办法:
POST /_cluster/reroute?retry_failed=true
重新恢复失败的分片,一会集群就恢复为green。
还没有评论,来说两句吧...