## 背景
电商业务在过去的几年中呈现出快速增长的趋势,这导致了数据量的增加,同时也带来了数据处理和搜索的挑战。传统的关系型数据库在处理大量数据和高并发访问时,可能会遇到性能瓶颈和查询速度问题。因此,需要一种高性能、高可扩展性的搜索引擎来满足电商业务的需求。
## 简介
Elasticsearch 是一个基于 Lucene 构建的开源、分布式、RESTful 接口的全文搜索引擎,其每个字段均可被索引,且能够横向扩展至数以百计的服务器存储以及处理 TB 级的数据,其可以在极短的时间内存储、搜索和分析大量的数据。
作为一款基于RESTful API的分布式服务,Elasticsearch可以快速地、近乎于准实时地存储、查询和分析超大数据集,通常被用来作为构建复杂查询特性和需求强大应用的基础引擎或技术。
由于其强大的搜索能力、灵活的扩展性和丰富的功能特性,Elasticsearch在数据分析和搜索领域非常受欢迎。
## 基础知识
### 概念
* 节点和集群:理解Elasticsearch中的节点(Node)和集群(Cluster)的概念,以及它们如何协同工作。
* 索引(Index):索引是Elasticsearch中的核心概念,与关系型数据库中的数据库相似,但有其特殊性。
* 类型(Type)和文档(Document):在Elasticsearch 7.x之后,一个索引中只允许有一个类型,到Elasticsearch 8.x之后类型已经被移除,但了解其历史概念对理解Elasticsearch的发展有帮助。
* 分片(Shard)和副本(Replica):理解分片和副本的概念对于掌握Elasticsearch的数据分布和容错机制至关重要。
### 数据索引
* 文档映射(Mapping):学习如何定义文档的字段类型、分析器等属性。
* 索引管理:包括创建索引、更新映射、删除索引等操作。
### 搜索技术
* 查询DSL:Elasticsearch提供了一种丰富的查询DSL(Domain Specific Language),用于执行复杂的搜索操作。
* 聚合(Aggregations):聚合提供了从数据中提取洞察力的能力,类似于SQL中的GROUP BY操作。
### 性能优化
* 分片策略:学习如何根据数据量和查询模式来合理分配分片。
* 缓存和刷新:理解Elasticsearch中的各种缓存机制以及如何通过合理配置提高搜索性能。
### 集群管理
* 监控和诊断:学习如何监控Elasticsearch集群的健康状况和性能指标。
* 扩展和故障转移:了解如何在不中断服务的情况下扩展集群和处理节点故障。
## ElasticSearch与传统搜索引擎
ElasticSearch与传统搜索引擎的主要区别在于数据存储和查询方式。传统搜索引擎通常采用基于文件系统的数据存储,并使用自然语言处理技术进行查询。而ElasticSearch则采用基于内存的数据存储,并使用Lucene库进行查询。这使得ElasticSearch具有更高的查询速度和可扩展性。
## 索引和查询的基本原理
ElasticSearch的核心原理是基于Lucene库的索引和查询机制。索引是将文档存储在磁盘上的过程,查询是从索引中搜索文档的过程。
### 索引的基本原理
索引的过程包括以下步骤:
1. 文档解析:将文档中的字段和值解析成一个内部表示。
2. 分析:将文本字段通过分析器转换为索引用的形式。
3. 存储:将解析和分析后的内容存储到磁盘上的索引文件中。
### 查询的基本原理
查询的过程包括以下步骤:
1. 解析:将查询请求解析成一个查询对象。
2. 搜索:根据查询对象从索引中搜索匹配的文档。
3. 排序:将搜索出的文档按照排序规则进行排序。
4. 高亮:将查询关键词标注为高亮显示。
### 具体操作步骤
1. 安装和配置:安装ElasticSearch并配置相关参数。
2. 创建索引:创建一个索引,用于存储文档。
3. 添加文档:将文档添加到索引中。
4. 查询文档:根据查询条件搜索文档。
5. 更新文档:更新文档的内容。
6. 删除文档:删除文档。
7. 查询分析:查看查询的分析结果。
## 最佳实践
### 安装和配置
这里的ElasticSearch搜索服务直接使用阿里云Elasticsearch。阿里云Elasticsearch是基于开源Elasticsearch构建的全托管Elasticsearch云服务,在100%兼容开源功能的同时,支持开箱即用。
![](https://img.kancloud.cn/16/29/1629c348fc7167fd428d595a7315c8f8_805x211.png)
**客户端SDK安装**
这里使用Elasticsearch PHP客户端。
> 更多:https://www.elastic.co/guide/en/elasticsearch/client/php-api/current/index.html
```
composer require elasticsearch/elasticsearch
```
### 配置Elasticsearch
案例客户端`ElasticSearchCLient`
```
<?php
/**
* @desc ElasticSearchCLient
* @author Tinywan(ShaoBo Wan)
*/
declare(strict_types=1);
namespace search;
use Elasticsearch\Client;
use Elasticsearch\ConnectionPool\SimpleConnectionPool;
class ElasticSearchCLient
{
/**
* @var Client|null
*/
protected static ?Client $instance = null;
private function __construct()
{
echo 'I am Constructed';
}
/**
* @desc: 实例
* @return Client|null
*/
public static function getInstance(): ?Client
{
if (is_null(self::$instance)) {
static::$instance = \Elasticsearch\ClientBuilder::create()
->setHosts([
[
'host' => '127.0.0.1',
'port' => '9200',
'scheme' => 'http',
'user' => 'elastic',
'pass' => 'elastic'
]
])
->setConnectionPool(SimpleConnectionPool::class)
->setRetries(10)
->build();
}
return static::$instance;
}
}
```
### 文档模型
定义一个简单的文档模型
#### 创建一个文档索引
```
/**
* @desc 创建一个索引
* @return Response
* @author Tinywan(ShaoBo Wan)
*/
public function createIndex(): Response
{
$client = ElasticSearchCLient::getInstance();
$indexParams = [
'index' => 'resty_product_test_index', // 索引名称
];
$indexResponse = $client->indices()->create($indexParams);
return response_json('success',0,$indexResponse);
}
```
#### 添加文档到ES
```
/**
* @desc 添加文档到Elasticsearch
* @return Response
* @author Tinywan(ShaoBo Wan)
*/
public function addDocument(): Response
{
$client = ElasticSearchCLient::getInstance();
$data = [
'id' => 20245,
'title' => '开源技术小栈20245直播间',
'content' => '开源技术小栈-腾讯云开发者社区,开源技术小栈20245直播间',
];
$indexParams = [
'index' => 'resty_product_test_index', // 索引名称
'id' => $data['id'], // 文档ID
'body' => $data,
'client' => [
'timeout' => 10,
'connect_timeout' => 10
]
];
$indexResponse = $client->index($indexParams);
return response_json('success',0,$indexResponse);
}
```
响应结果
```json
{
"code": 0,
"msg": "success",
"data": {
"_index": "resty_product_test_index",
"_type": "_doc",
"_id": "20245",
"_version": 1,
"result": "created",
"_shards": {
"total": 2,
"successful": 2,
"failed": 0
},
"_seq_no": 4,
"_primary_term": 1
}
}
```
#### 搜索文档
```
/**
* @desc 搜索文档
* @return Response
* @author Tinywan(ShaoBo Wan)
*/
public function searchDocument(): Response
{
$client = ElasticSearchCLient::getInstance();
$query = '开源技术小栈';
$indexParams = [
'index' => 'resty_product_test_index',
'body' => [
'query' => [
'multi_match' => [
'query' => $query,
'fields' => ['title', 'content'],
]
]
]
];
$indexResponse = $client->search($indexParams);
return response_json('success',0,$indexResponse);
}
```
搜索结果
```
{
"took": 12,
"timed_out": false,
"_shards": {
"total": 1,
"successful": 1,
"skipped": 0,
"failed": 0
},
"hits": {
"total": {
"value": 2,
"relation": "eq"
},
"max_score": 1.5399661,
"hits": [
{
"_index": "resty_product_test_index",
"_type": "_doc",
"_id": "2024",
"_score": 1.5399661,
"_source": {
"id": 2024,
"title": "开源技术小栈20240724直播间",
"content": "开源技术小栈-腾讯云开发者社区,开源技术小栈20240724直播间"
}
},
{
"_index": "resty_product_test_index",
"_type": "_doc",
"_id": "20245",
"_score": 1.5399661,
"_source": {
"id": 20245,
"title": "开源技术小栈20245直播间",
"content": "开源技术小栈-腾讯云开发者社区,开源技术小栈20245直播间"
}
}
]
}
}
```
- 设计模式系列
- 工厂方法模式
- 序言
- Windows程序注册为服务的工具WinSW
- 基础
- 安装
- 开发规范
- 目录结构
- 配置
- 快速入门
- 架构
- 请求流程
- 架构总览
- URL访问
- 容器和依赖注入
- 中间件
- 事件
- 代码层结构
- 四个层次
- 路由
- 控制器
- 请求
- 响应
- 数据库
- MySQL实时同步数据到ES解决方案
- 阿里云DTS数据MySQL同步至Elasticsearch实战
- PHP中的MySQL连接池
- PHP异步非阻塞MySQL客户端连接池
- 模型
- 视图
- 注解
- @SpringBootApplication(exclude={DataSourceAutoConfiguration.calss})
- @EnableFeignClients(basePackages = "com.wotu.feign")
- @EnableAspectJAutoProxy
- @EnableDiscoveryClient
- 错误和日志
- 异常处理
- 日志处理
- 调试
- 验证
- 验证器
- 验证规则
- 扩展库
- 附录
- Spring框架知识体系详解
- Maven
- Maven和Composer
- 构建Maven项目
- 实操课程
- 01.初识SpringBoot
- 第1章 Java Web发展史与学习Java的方法
- 第2章 环境与常见问题踩坑
- 第3章 springboot的路由与控制器
- 02.Java编程思想深度理论知识
- 第1章 Java编程思想总体
- 第2章 英雄联盟的小案例理解Java中最为抽象的概念
- 第3章 彻底理解IOC、DI与DIP
- 03.Spring与SpringBoot理论篇
- 第1章 Spring与SpringBoot导学
- 第2章 Spring IOC的核心机制:实例化与注入
- 第3章 SpringBoot基本配置原理
- 04.SprinBoot的条件注解与配置
- 第1章 conditonal 条件注解
- 第2章 SpringBoot自动装配解析
- 05.Java异常深度剖析
- 第1章 Java异常分类剖析与自定义异常
- 第2章 自动配置Url前缀
- 06.参数校验机制与LomBok工具集的使用
- 第1章 LomBok工具集的使用
- 第2章 参数校验机制以及自定义校验
- 07.项目分层设计与JPA技术
- 第1章 项目分层原则与层与层的松耦合原则
- 第2章 数据库设计、实体关系与查询方案探讨
- 第3章 JPA的关联关系与规则查询
- 08.ORM的概念与思维
- 第1章 ORM的概念与思维
- 第2章 Banner等相关业务
- 第3章 再谈数据库设计技巧与VO层对象的技巧
- 09.JPA的多种查询规则
- 第1章 DozerBeanMapper的使用
- 第2章 详解SKU的规格设计
- 第3章 通用泛型Converter
- 10.令牌与权限
- 第1章 通用泛型类与java泛型的思考
- 常见问题
- 微服务
- demo
- PHP中Self、Static和parent的区别
- Swoole-Cli
- 为什么要使用现代化PHP框架?
- 公众号
- 一键部署微信公众号Markdown编辑器(支持适配和主题设计)
- Autodesigner 2.0发布
- Luya 一个现代化PHP开发框架
- PHPZip - 创建、读取和管理 ZIP 文件的简单库
- 吊打Golang的PHP界天花板webman压测对比
- 简洁而强大的 YAML 解析库
- 推荐一个革命性的PHP测试框架:Kahlan
- ServBay下一代Web开发环境
- 基于Websocket和Canvas实现多人协作实时共享白板
- Apipost预执行脚本如何调用外部PHP语言
- 认证和授权的安全令牌 Bearer Token
- Laradock PHP 的 Docker 完整本地开发环境
- 高效接口防抖策略,确保数据安全,避免重复提交的终极解决方案!
- TIOBE 6月榜单:PHP稳步前行,编程语言生态的微妙变化
- Aho-Corasick字符串匹配算法的实现
- Redis键空间通知 Keyspace Notification 事件订阅
- ServBay如何启用并运行Webman项目
- 使用mpdf实现导出pdf文件功能
- Medoo 轻量级PHP数据库框架
- 在PHP中编写和运行单元测试
- 9 PHP运行时基准性能测试
- QR码生成器在PHP中的源代码
- 使用Gogs极易搭建的自助Git服务
- Gitea
- webman如何记录SQL到日志?
- Sentry PHP: 实时监测并处理PHP应用程序中的错误
- Swoole v6 Alpha 版本已发布
- Proxypin
- Rust实现的Redis内存数据库发布
- PHP 8.4.0 Alpha 1 测试版本发布
- 121
- Golang + Vue 开发的开源轻量 Linux 服务器运维管理面板
- 内网穿透 FRP VS Tailscale
- 新一代开源代码托管平台Gitea
- 微服务系列
- Nacos云原生配置中心介绍与使用
- 轻量级的开源高性能事件库libevent
- 国密算法
- 国密算法(商用密码)
- GmSSL 支持国密SM2/SM3/SM4/SM9/SSL 密码工具箱
- GmSSL PHP 使用
- 数据库
- SQLite数据库的Web管理工具
- 阿里巴巴MySQL数据库强制规范
- PHP
- PHP安全测试秘密武器 PHPGGC
- 使用declare(strict_types=1)来获得更健壮的PHP代码
- PHP中的魔术常量
- OSS 直传阿里腾讯示例
- PHP源码编译安装APCu扩展实现数据缓存
- BI性能DuckDB数据管理系统
- 为什么别人可以是架构师!而我却不是?
- 密码还在用 MD5 加盐?不如试试 password_hash
- Elasticsearch 在电商领域的应用与实践
- Cron 定时任务入门
- 如何动态设置定时任务!而不是写死在Linux Crontab
- Elasticsearch的四种查询方式,你知道多少?
- Meilisearch vs Elasticsearch
- OpenSearch vs Elasticsearch
- Emlog 轻量级开源博客及建站系统
- 现代化PHP原生协程引擎 PRipple
- 使用Zephir编写C扩展将PHP源代码编译加密
- 如何将PHP源代码编译加密,同时保证代码能正常的运行
- 为什么选择Zephir给PHP编写动态扩展库?
- 使用 PHP + XlsWriter实现百万级数据导入导出
- Rust编写PHP扩展
- 阿里云盘开放平台对接进行文件同步
- 如何构建自己的PHP静态可执行文件
- IM后端架构
- RESTful设计方法和规范
- PHP编译器BPC 7.3 发布,成功编译ThinkPHP8
- 高性能的配置管理扩展 Yaconf
- PHP实现雪花算法库 Snowflake
- PHP官方现代化核心加密库Sodium
- pie
- 现代化、精简、非阻塞PHP标准库PSL
- PHP泛型和集合
- 手把手教你正确使用 Composer包管理
- JWT双令牌认证实现无感Token自动续期
- 最先进PHP大模型深度学习库TransformersPHP
- PHP如何启用 FFI 扩展
- PHP超集语言PXP
- 低延迟双向实时事件通信 Socket.IO
- PHP OOP中的继承和多态
- 强大的现代PHP高级调试工具Kint
- PHP基金会
- 基于webman+vue3高质量中后台框架SaiAdmin
- 开源免费的定时任务管理系统:Gocron
- 简单强大OCR工具EasyOCR在PHP中使用
- PHP代码抽象语法树工具PHP AST Viewer
- MySQL数据库管理工具PHPMyAdmin
- Rust编写的一款高性能多人代码编辑器Zed
- 超高性能PHP框架Workerman v5.0.0-beta.8 发布
- 高并发系列
- 入门介绍及安装
- Lua脚本开发 Hello World
- 执行流程与阶段详解
- Nginx Lua API 接口开发
- Lua模块开发
- OpenResty 高性能的正式原因
- 记一次查找 lua-resty-mysql 库 insert_id 的 bug
- 包管理工具OPM和LuaRocks使用
- 异步非阻塞HTTP客户端库 lua-resty-http
- Nginx 内置绑定变量
- Redis协程网络库 lua-resty-redis
- 动态HTML渲染库 lua-testy-template
- 单独的
- StackBlitz在线开发环境
- AI
- 基础概念
- 12312
- 基础镜像的坑
- 利用phpy实现 PHP 编写 Vision Transformer (ViT) 模型
- 语义化版本 2.0.0