##
数据输入:文档和索引
Elasticsearch是一个分布式文档存储。Elasticsearch不会将信息存储为列数据的行,而是存储已序列化为JSON文档的复杂数据结构。当集群中有多个Elasticsearch节点时,存储的文档将分布在集群中,并且可以从任何节点立即访问。
存储文档时,将在1秒钟内几乎实时地对其进行索引和完全搜索。Elasticsearch使用称为倒排索引的数据结构,该结构支持非常快速的全文本搜索。反向索引列出了出现在任何文档中的每个唯一单词,并标识了每个单词出现的所有文档。
索引可以认为是文档的优化集合,每个文档都是字段的集合,这些字段是包含数据的键值对。默认情况下,Elasticsearch对每个字段中的所有数据建立索引,并且每个索引字段都具有专用的优化数据结构。例如,文本字段存储在倒排索引中,数字字段和地理字段存储在BKD树中。使用按字段数据结构组合并返回搜索结果的能力使Elasticsearch如此之快。
Elasticsearch还具有无模式的能力,这意味着无需显式指定如何处理文档中可能出现的每个不同字段即可对文档建立索引。启用动态映射后,Elasticsearch自动检测并向索引添加新字段。这种默认行为使索引和浏览数据变得容易-只需开始建立索引文档,Elasticsearch就会检测布尔值,浮点数和整数值,日期和字符串并将其映射到适当的Elasticsearch数据类型。
但是,最终,您比Elasticsearch更了解您的数据以及如何使用它们。您可以定义规则来控制动态映射,也可以显式定义映射以完全控制字段的存储和索引方式。
定义自己的映射使您能够:
* 区分全文字符串字段和精确值字符串字段
* 执行特定于语言的文本分析
* 优化字段以进行部分匹配
* 使用自定义日期格式
* 使用无法自动检测到的数据类型,例如`geo_point`和`geo_shape`
为不同的目的以不同的方式对同一字段建立索引通常很有用。例如,您可能希望将一个字符串字段索引为全文搜索的文本字段和索引关键字,以便对数据进行排序或汇总。或者,您可能选择使用多个语言分析器来处理包含用户输入的字符串字段的内容。
在搜索时也会使用在索引期间应用于全文字段的分析链。当您查询全文字段时,对查询文本进行相同的分析,然后才能在索引中查找术语。
- Elasticsearch简介
- 数据输入:文档和索引
- 信息输出:搜索和分析
- 可扩展性和弹性
- Elasticsearch入门
- 启动并运行Elasticsearch
- 索引文件
- 开始搜索
- 使用汇总分析结果
- 从这里开始
- 设置Elasticsearch
- 安装Elasticsearch
- 从Linux或MacOS上的存档安装Elasticsearch
- 在Windows上安装Elasticsearch
- 使用Debian软件包安装Elasticsearch
- 使用RPM安装Elasticsearch
- 使用Windows MSI安装程序安装Elasticsearch
- 使用Docker安装Elasticsearch
- 使用Homebrew在macOS上安装Elasticsearch
- 配置Elasticsearch
- 设置JVM选项
- 安全设定
- 记录配置
- 审核设置
- 跨集群复制设置
- 转换设定
- 索引生命周期管理设置
- 许可设置
- 机器学习设置
- 监控设定
- 保护设置
- SQL访问设置
- 观察者设置
- 重要的Elasticsearch配置
- path.data 和 path.logs
- cluster.name
- node.name
- network.host
- 发现和集群形成设置
- 设置堆大小
- JVM堆转储路径
- GC记录
- 临时目录
- JVM致命错误日志
- 重要系统配置
- 配置系统设置
- 禁用交换
- 文件描述符
- 虚拟内存
- 线程数
- DNS缓存设置
- JNA临时目录未装入 noexec
- 引导检查
- 堆大小检查
- 文件描述符检查
- 内存锁检查
- 最大线程数检查
- 最大文件大小检查
- 虚拟内存最大大小检查
- 最大地图计数检查
- 客户端JVM检查
- 使用串行收集器检查
- 系统调用过滤器检查
- OnError和OnOutOfMemoryError检查
- 抢先检查
- G1GC检查
- 所有权限检查
- 发现配置检查
- 启动Elasticsearch
- 停止Elasticsearch
- 将节点添加到集群
- 全集群重启和滚动重启
- 设置X-Pack
- 配置X-Pack Java客户端
- 引导程序检查X-Pack
- 升级Elasticsearch
- 滚动升级
- 完整集群重新启动升级
- 升级前重新索引
- 重新索引到位
- 从远程群集重新索引
- 集合
- 度量聚合
- 平均聚合
- 加权平均聚合
- 基数聚合
- 扩展统计汇总
- 地理边界聚合
- 地心聚集
- 最大聚集
- 最小集合
- 百分位数汇总
- 百分数排名汇总
- 脚本式指标聚合
- 统计汇总
- 字符串统计汇总
- 总和
- 热门合集
- 价值计数汇总
- 中位数绝对偏差汇总
- 桶聚合
- 邻接矩阵汇总
- 自动间隔日期直方图聚合
- 子集聚集
- 复合聚集
- 日期直方图汇总
- 日期范围汇总
- 多元化的采样器聚合
- 筛选器汇总
- 筛选汇总
- 地理距离汇总
- GeoHash网格聚合
- GeoTile网格聚合
- 全局聚合
- 直方图聚合
- IP范围汇总
- 缺少聚合
- 嵌套聚合
- 父级汇总
- 范围汇总
- rare terms 聚集
- 反向嵌套聚合
- 采样器聚合
- 重要术语汇总
- 重要的文字汇整
- 术语汇总
- 铲斗范围字段的精妙之处
- 管道聚合
- 平均存储桶聚合
- 导数聚合
- 最大存储桶聚合
- 最小存储桶聚合
- 总和桶聚合
- 统计数据桶汇总
- 扩展的统计数据桶聚合
- 百分位桶聚合
- 查询DSL
- 查询和过滤上下文
- 跨集群搜索
- 脚本编写
- 如何使用脚本
- 映射
- 删除映射类型
- 文字分析
- 文字分析总览
- 模组
- 发现和集群形成
- 索引模块
- 分析
- 摄取节点
- 管道定义
- 管理索引生命周期
- 索引总览
- SQL访问
- SQL总览
- 监控集群
- 监控总览
- 冻结指标
- 最佳实务
- 汇总或转换数据
- 汇总历史数据
- 设置集群以实现高可用性
- 备份集群
- 快照和还原
- 注册资料库
- 保护集群
- 安全概述
- 警报群集和索引事件
- Watcher入门
- 命令行工具
- 弹性搜索证书
- 如何
- 一般建议
- 专业术语
- REST API
- API约定
- 发布要点
- 7.6.0
- 重大变化
- 7.6
- 发行说明
- Elasticsearch版本7.6.2