💎一站式轻松地调用各大LLM模型接口,支持GPT4、智谱、星火、月之暗面及文生图 广告
![](https://box.kancloud.cn/aa4fb7dda4861f75f43fc05e236e12d5_866x650.jpg) ![](https://box.kancloud.cn/257c154f2d12e9bb9594163cfde02075_1189x611.png) --- **gateway支持的索引** 当elasticsearch关闭再启动的时候,它就会从这个gateway里面读取索引数据 --- **DistributedLucene Directory** Lucene的框架 --- **倒数第三层** 数据处理模块,加工处理方式 * index module 创建index的模块 * search module 搜索模块 * mapping 定义索引下面type的处理规则,索引数据如何建立,索引数据类型 * river 插件,从外部获取异构数据,然后在elasticsearch里面创建索引,常见的插件有RabbitMQ还有Twitter River --- **第三层** **Discovery** zen 是节点自动发现,自动注册,如果master节点发生故障,其他节点会自动选举出一个新的master节点 他是一个p2p的系统,首先通过广播的机制寻找存在的节点,然后通过多播协议进行节点的通信,同时也支持点对点的交互 **scripting** 脚本支持的功能 **3 Plugins** 支持的第三方插件,中文分词,状态监控 --- **第二层** **Transport** 交互方式,有3种协议,默认用http协议来进行交互的 --- **第一层** 用resultapi进行交互 还可以通过java来开发工具 --- **es的更新** ![](https://box.kancloud.cn/9c94c3e93d25a5a6755df9ff3ef4cfa4_551x236.png) --- **近实时检索** 他里面有个refash的api 如果你把refash这个api设置成1秒,每秒生成个segment,这时候这个segment会比较小通常只有几k,这样不好,会有很多segment 生成segment的开销很大,生成倒排索引是很复杂的,能写个大的文件尽量写个大文件 后面合并会耗费大量资源 refash设置比较大点,他导入会很快,一下子写个大的索引,性能会提升上来 refash是把之前的segment进行close掉,close掉变为只读的,这时候才能给你查,他会生成新的segment但是这时候还是不能查询的 refresh api ![](https://box.kancloud.cn/3f06cf811c0990a0bd05a3d979e330c0_596x421.png) 如果想尽快的导入,不关心查询,就把refash关闭掉,把他值设置为-1 针对某个索引refresh,如果你对所有的这样,会把机器拖垮,其他也类似 --- **gateway参数** ![](https://box.kancloud.cn/d6291bbefb3294809759e33d6da186f1_475x143.png) 第一个表示存在本地磁盘上面 expected-nodes我们集群应该有10个节点 recover_after_nodes当我们集群有8个节点我们应该开始最新数据的恢复操作了 recover_after_time当他找到8个节点的时候,等5分钟再恢复,为了是稍后可能有2个节点稍后加进来,防止不断的数据恢复和平衡,一般在95%左右 --- **元数据** ![](https://box.kancloud.cn/1b07e5e8cad92cee1ab01e5881e087d9_1284x370.png) ![](https://box.kancloud.cn/0bbd383a226d1caa0ca43fcd8c53350b_1284x184.png)