ES安全重启

admin • 2024-01-26 20:33 • 5G

背景

elasticsearch 集群，有时候可能需要修改配置，增加硬盘，扩展内存等操作，需要对节点进行维护升级。

        但是记住es是内存数据库，而且同步到磁盘并不是同步的，所以一旦全部重启es，es数据会大量丢失掉，业务也无法正常进行。这是不可忍受的

        业务不能停，如果直接kill掉节点，可能导致数据丢失，而且集群会认为该节点挂掉了，就开始转移数据，当重启之后，它又会恢复数据，如果你当前的数据量已经很大了，这是很耗费机器和网络资源的。正常情况下，Elasticsearch 希望你的数据被完全的复制和均衡的分布。
        如果你手动关闭了一个节点，集群会立刻发现节点的丢失并开始再平衡。
        如果节点的维护是短期工作的话，这一点就很烦人了，因为大型分片的再平衡需要花费相当的时间.一个集群节点重启前要先临时禁用自动分配，设置cluster.routing.allocation.enable为none，否则节点停止后当前节点的分片会自动分配到其他节点上，本节点启动后需要等其他节点RECOVERING后才会RELOCATING，也就是分片在其他节点恢复后又转移回来，浪费大量时间。

# 1. 关闭shard自动均衡
curl -X PUT "localhost:9200/_cluster/settings?pretty" -H 'Content-Type: application/json' -d'
{
  "persistent": {
    "cluster.routing.allocation.enable": "none"
  }
}
'

# 2. 停止非必要的索引并执行同步刷新(可选)
POST /_flush/synced?pretty

# 3. 停止并升级单个节点 
如果您使用以下命令运行Elasticsearch systemd：
sudo systemctl stop elasticsearch.service
 
如果您正在使用SysV运行Elasticsearch init：
sudo -i service elasticsearch stop
 
如果您将Elasticsearch作为守护程序运行：
kill $(cat pid.txt)

# 4. 升级节点

# 5. 启动升级后的节点
#启动现在升级的节点，通过检查日志文件或检查此请求的输出来确认它加入了集群

GET _cat/nodes

## 6.打开shard重新分配
curl -X PUT "localhost:9200/_cluster/settings?pretty" -H 'Content-Type: application/json' -d'
{
  "persistent": {
    "cluster.routing.allocation.enable": "all"
  }
}

# 7. 等待节点恢复
GET /_cat/health?pretty

#没有同步刷新的碎片可能需要一些时间来恢复。单个分片的恢复状态可以通过_cat/recovery请求监控
GET /_cat/recovery?pretty

# 8. 重复
#当集群稳定且节点恢复后，对所有剩余节点重复上述步骤

注意：

执行同步刷新时，请检查响应以确保没有失败。尽管请求本身仍返回200 OK状态，但在响应正文中列出了由于挂起索引操作而失败的同步刷新操作。如果失败，请重新发出请求。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

大数据搜索引擎

二维码

SQLServer,MySQL,Oracle三种数据库优缺点和差异

< <上一篇

Ruby安装与使用指南

下一篇>>

搜索内容

ES安全重启

背景

最新文章

分类

标签云