索引文档流程 · Elasticsearch7.x

:-: ![](https://img.kancloud.cn/28/ff/28fffdd07c545ca27f71a3dabdd1a98c_921x332.png) 1. 协调节点默认使用文档 `_id` 参与计算（或者通过 `routing`），以便为路由提供合适的分片位置，计算公式如下： ``` shard = hash(document_id) % (num_of_primary_shards) num_of_primary_shards：主分片的数量 ``` 2. 当分片所在的节点接收到来自协调节点的请求后，会将请求写入到 Memory Buffer，然后定时（默认是每隔 1 秒）写入到 Filesystem Cache，这个从 Memory Buffer 到 Filesystem Cache 的过程就叫做 refresh。 3. 当然在某些情况下，存在 Momery Buffer 和 Filesystem Cache 的数据可能会丢失，ES 是通过 translog的机制来保证数据的可靠性的。其实现机制是接收到请求后，同时也会写入到 translog 中，当 Filesystem cache 中的数据写入到磁盘中时，才会清除掉，这个过程叫做 flush。在 flush 过程中，内存中的缓冲将被清除，内容被写入一个新段，段的 fsync 将创建一个新的提交点，并将内容刷新到磁盘，旧的 translog 将被删除并开始一个新的 translog。 flush 触发的时机是定时触发（默认 30 分钟）或者 translog 变得太大（默认为 512M）时。