## 指数的一些文档
集群启动并运行后,就可以为某些数据建立索引了。Elasticsearch有多种摄取选项,但最终它们都做同样的事情:将JSON文档放入Elasticsearch索引中。
您可以通过一个简单的PUT请求直接执行此操作,该请求指定要添加文档的索引,唯一的文档ID以及`"field": "value"`请求正文中的一对或多对:
~~~
PUT /customer/_doc/1
{
"name": "John Doe"
}
~~~
如果该请求`customer`尚不存在,该请求将自动创建该索引,添加ID为的新文档`1`,并存储该`name`字段并为其建立索引。
由于这是一个新文档,因此响应显示该操作的结果是创建了该文档的版本1:
~~~
{
"_index" : "customer",
"_type" : "_doc",
"_id" : "1",
"_version" : 1,
"result" : "created",
"_shards" : {
"total" : 2,
"successful" : 2,
"failed" : 0
},
"_seq_no" : 26,
"_primary_term" : 4
}
~~~
可以从群集中的任何节点立即使用新文档。您可以使用指定其文档ID的GET请求检索它:
~~~
GET /customer/_doc/1
~~~
该响应表明找到了具有指定ID的文档,并显示了已索引的原始源字段。
~~~
{
"_index" : "customer",
"_type" : "_doc",
"_id" : "1",
"_version" : 1,
"_seq_no" : 26,
"_primary_term" : 4,
"found" : true,
"_source" : {
"name": "John Doe"
}
}
~~~
### 在索引文件批量
如果您有很多要编制索引的文档,则可以使用[批量API](https://www.elastic.co/guide/en/elasticsearch/reference/7.6/docs-bulk.html)批量提交。使用批量处理批处理文档操作比单独提交请求要快得多,因为它可以最大程度地减少网络往返次数。
最佳批处理大小取决于许多因素:文档大小和复杂性,索引编制和搜索负载以及群集可用的资源。一个好的起点是批处理1,000至5,000个文档,总有效负载在5MB至15MB之间。从那里,您可以尝试找到最佳位置。
要将一些数据导入Elasticsearch,您可以开始搜索和分析:
1. 下载[`accounts.json`](https://github.com/elastic/elasticsearch/blob/master/docs/src/test/resources/accounts.json?raw=true)样本数据集。此随机生成的数据集中的文档代表具有以下信息的用户帐户:
~~~
{
"account_number": 0,
"balance": 16623,
"firstname": "Bradshaw",
"lastname": "Mckenzie",
"age": 29,
"gender": "F",
"address": "244 Columbus Place",
"employer": "Euron",
"email": "bradshawmckenzie@euron.com",
"city": "Hobucken",
"state": "CO"
}
~~~
2. `bank`使用以下`_bulk`请求将帐户数据索引到索引中:
~~~
curl -H "Content-Type: application/json" -XPOST "localhost:9200/bank/_bulk?pretty&refresh" --data-binary "@accounts.json"
curl "localhost:9200/_cat/indices?v"
~~~
响应表明成功索引了1,000个文档。
~~~
health status index uuid pri rep docs.count docs.deleted store.size pri.store.size
yellow open bank l7sSYV2cQXmu6_4rJWVIww 5 1 1000 0 128.6kb 128.6kb
~~~
- Elasticsearch简介
- 数据输入:文档和索引
- 信息输出:搜索和分析
- 可扩展性和弹性
- Elasticsearch入门
- 启动并运行Elasticsearch
- 索引文件
- 开始搜索
- 使用汇总分析结果
- 从这里开始
- 设置Elasticsearch
- 安装Elasticsearch
- 从Linux或MacOS上的存档安装Elasticsearch
- 在Windows上安装Elasticsearch
- 使用Debian软件包安装Elasticsearch
- 使用RPM安装Elasticsearch
- 使用Windows MSI安装程序安装Elasticsearch
- 使用Docker安装Elasticsearch
- 使用Homebrew在macOS上安装Elasticsearch
- 配置Elasticsearch
- 设置JVM选项
- 安全设定
- 记录配置
- 审核设置
- 跨集群复制设置
- 转换设定
- 索引生命周期管理设置
- 许可设置
- 机器学习设置
- 监控设定
- 保护设置
- SQL访问设置
- 观察者设置
- 重要的Elasticsearch配置
- path.data 和 path.logs
- cluster.name
- node.name
- network.host
- 发现和集群形成设置
- 设置堆大小
- JVM堆转储路径
- GC记录
- 临时目录
- JVM致命错误日志
- 重要系统配置
- 配置系统设置
- 禁用交换
- 文件描述符
- 虚拟内存
- 线程数
- DNS缓存设置
- JNA临时目录未装入 noexec
- 引导检查
- 堆大小检查
- 文件描述符检查
- 内存锁检查
- 最大线程数检查
- 最大文件大小检查
- 虚拟内存最大大小检查
- 最大地图计数检查
- 客户端JVM检查
- 使用串行收集器检查
- 系统调用过滤器检查
- OnError和OnOutOfMemoryError检查
- 抢先检查
- G1GC检查
- 所有权限检查
- 发现配置检查
- 启动Elasticsearch
- 停止Elasticsearch
- 将节点添加到集群
- 全集群重启和滚动重启
- 设置X-Pack
- 配置X-Pack Java客户端
- 引导程序检查X-Pack
- 升级Elasticsearch
- 滚动升级
- 完整集群重新启动升级
- 升级前重新索引
- 重新索引到位
- 从远程群集重新索引
- 集合
- 度量聚合
- 平均聚合
- 加权平均聚合
- 基数聚合
- 扩展统计汇总
- 地理边界聚合
- 地心聚集
- 最大聚集
- 最小集合
- 百分位数汇总
- 百分数排名汇总
- 脚本式指标聚合
- 统计汇总
- 字符串统计汇总
- 总和
- 热门合集
- 价值计数汇总
- 中位数绝对偏差汇总
- 桶聚合
- 邻接矩阵汇总
- 自动间隔日期直方图聚合
- 子集聚集
- 复合聚集
- 日期直方图汇总
- 日期范围汇总
- 多元化的采样器聚合
- 筛选器汇总
- 筛选汇总
- 地理距离汇总
- GeoHash网格聚合
- GeoTile网格聚合
- 全局聚合
- 直方图聚合
- IP范围汇总
- 缺少聚合
- 嵌套聚合
- 父级汇总
- 范围汇总
- rare terms 聚集
- 反向嵌套聚合
- 采样器聚合
- 重要术语汇总
- 重要的文字汇整
- 术语汇总
- 铲斗范围字段的精妙之处
- 管道聚合
- 平均存储桶聚合
- 导数聚合
- 最大存储桶聚合
- 最小存储桶聚合
- 总和桶聚合
- 统计数据桶汇总
- 扩展的统计数据桶聚合
- 百分位桶聚合
- 查询DSL
- 查询和过滤上下文
- 跨集群搜索
- 脚本编写
- 如何使用脚本
- 映射
- 删除映射类型
- 文字分析
- 文字分析总览
- 模组
- 发现和集群形成
- 索引模块
- 分析
- 摄取节点
- 管道定义
- 管理索引生命周期
- 索引总览
- SQL访问
- SQL总览
- 监控集群
- 监控总览
- 冻结指标
- 最佳实务
- 汇总或转换数据
- 汇总历史数据
- 设置集群以实现高可用性
- 备份集群
- 快照和还原
- 注册资料库
- 保护集群
- 安全概述
- 警报群集和索引事件
- Watcher入门
- 命令行工具
- 弹性搜索证书
- 如何
- 一般建议
- 专业术语
- REST API
- API约定
- 发布要点
- 7.6.0
- 重大变化
- 7.6
- 发行说明
- Elasticsearch版本7.6.2