> 索引是对数据库表中的一列或者多列的数据进行排序的一种结构,使用索引可快速访问数据表中的特定信息。
> pgsql提供了B-tree、Hash、Gin等索引类型,每种索引类型因采用不同的算法而适用于不同的查询场景。在未指定索引类型时,CREATE INDEX命令将创建B-tree 索引。
**基本术语:**
* 元组 - tuple,指的是行(包括heap tuple, index tuple等,都可以叫元组)。
* tid, ctid - 指行号(block\_number, item pointer),包括HEAP表的BLOCK NUMBER,以及在BLOCK中指向行的item pointer。
* 键值 - 指索引结构中的KEY
* 基表 - 创建索引的表
**索引的扫描方式:**
1. **Indexscan:** 根据查询索引找到匹配记录的[ctid](),再通过ctid去查堆表把相应的数据读出来
2. **Bitmapscan:** 通过索引找到匹配记录的ctid集合,在内存中建一个bitmap对ctid做集合运算和排序等,最后再根据bitmap中的数据文件把对应数据读取出来。
3. **Seq Scan:** 顺序扫描也叫做全表扫描,数据库的一种扫描方式,跟索引没啥关系,当语句是这种扫描方式时,说明该查询语句并没有走索引。
4. **Index Only Scan:** 这种索引方式说明索引字段中包含了所有返回字段,对vm文件中全为可见的数据块,不查堆表直接返回索引中的值
> [VM文件](http://docs.linchunyu.top/2280082#span_stylefontsize15pxVMspan_154)是可见性映射文件,如果存在vm文件,则表示该数据块没有需要清理的行,即该表做了vacuum操作。[vaccum命令](http://docs.linchunyu.top/2280082#span_stylefontsize15pxvacuumspan_198)时用来对表进行操作,回收已经删除元祖占据的存储空间
**索引分类:**
* **从索引的类型上区分:**
* 唯一索引: 唯一索引不允许任何重复的值插入到表。格式为:`CREATE UNIQUE INDEX index_name on table_name (column_name)`
* 单列索引:只基于表的一个列上创建的索引。格式为:
`CREATE INDEX index_name ON table_name (column_name);`
* 组合索引:基于表的多列上创建的索引。格式为:`CREATE INDEX index_name ON table_name (column1_name, column2_name)`
* 表达式索引:字段进行某种运算之后的结果创建索引、格式为:`CREATE INDEX index_name ON table_name(expression|column_name)`
* **从索引的实现方法上区分:**
* B-tree:创建索引时未指定类型时,默认创建B-tree索引
* Hash:此索引类型只能处理简单的等值比较
* Gin:通用倒排索引,可以与pg_trgm扩展配合使用以实现字符串匹配的全文检索,即全模糊搜索
* Gist:通用的搜索树(Generalized Search Tree)。 它是一种平衡树结构的访问方法,在系统中作为一个基本模版,可以使用它实现任意索引模式。B-trees, R-trees和许多其它的索引模式都可以用GiST实现
<table>
<thead>
<th width="10%">索引类型</th>
<th width="20%">说明</th>
<th width="20%" >适用场景</th>
<th>特性</th>
</thead>
<tbody>
<tr>
<td>B-tree</td>
<td>默认类型。使用btree索引,where条件必须包含第一个索引列</td>
<td>B-tree索引适合用于存储排序的数据,并支持=,>,>=,<,<=,以及between,in,is null等操作符和以字符串开头的模糊查询(前模糊)</td>
<td>1、 在PostgreSQL13中,Btree索引新增了Deduplication特性,使得PG数据库有了新的方式去处理重复的索引键值,这大大减小了btree索引所占用的空间,提升了索引扫描的性能,deduplication涉及到底层索引存储结构的变更。在13版本之前,每一个重复的数据都会占用索引的一个叶子元组leaf,这些重复的key值在索引页面中重复存储,带来很大的空间浪费。通过deduplicate_items 参数开启(默认开启)<br>2、 在PostgreSQL当前支持的索引类型中,只有B-tree可以产生排序的输出,当ORDER BY与LIMIT n组合:显式排序将必须处理所有数据以识别前n行,但如果存在与ORDER BY匹配的索引,则可以直接检索前n行,而不扫描其余部分。升序默认null值放在最后,可以使用NULLS FIRST和/或NULLS LAST选项来进行调整。<br>3、支持多列索引,最多可以指定32列,使用最左匹配原则</td>
</tr>
<tr>
<td>Hash</td>
<td>此索引类型只能处理简单的等值比较</td>
<td>= 操作符</td>
<td>1、由于hash函数没有特定的排序规则,所以一般的hash索引只支持等值查<br>2、hash索引也不会处理null值,所以不会标记null值<br>3、hash索引不存储索引键,只存储hash码,所以不会 index-only扫描,也不支持多列创建hash索引<br>4、从10版本开始,可以通过pageinspect插件查看hash索引的内部情况 `create extension pageinspect`</td>
</tr>
<tr>
<td>Gin</td>
<td>通用倒排索引,是一个存储对(key, posting list)集合的索引结构,其中key是一个键值,而posting list 是一组出现过key的位置</td>
<td>1、多值类型(数组、全文检索、枚举、网络地址类型):包含、相交<br>2、JSON类型<br>
3、普通类型(通过btree_gin 插件支持):与B-Tree类似<br>4、字符串(通过pg_trgm 插件支持):模糊查询、相似查询<br>5、 多列:任意列组合查询</td>
<td>1、在表中的每一个属性,在建立索引时,都可能会被解析为多个键值<br>2、通过这种索引结构可以快速的查找到包含指定关键字的元组,因此GIN索引特别适用于多值类型的元素搜索,比如支持全文搜索,数组中元素的搜索<br>3、Gin索引创建耗时比btree索引长约10倍,对频繁更新的表字段不建议使用</td>
</tr>
<tr>
<td>Gist</d>
<td>通用搜索树,一种平衡树结构的访问方法,在系统中作为一个基本模版,可以使用它实现任意索引模式。B-trees, R-trees和许多其它的索引模式都可以用GiST实现</td>
<td>1、空间类型:方位(上、下、左、右),空间关系(相交、包含),空间距离排序(KNN)<br>2、范围数据:=, &&, , >, -|-, &<br>3、普通类型:与B-Tree类似,增加空间类型类似操作符<br>4、数组类型<br>5、多列:任意列组合查询</td>
<td>1、可通过btree_gist扩展,支持多种数据类型的 B 树等效功能<br>2、可通过cube扩展,支持多维立方体的索引<br>3、可通过hstore扩展,支持存储键值对模块的索引<br>4、可通过intarray扩展,支持一维 int4 值数组的 RD 树的索引<br>5、可通过ltree扩展,支持树状结构的索引<br>6、可通过pg_trgm扩展,支持全文检索,模糊搜索<br>7、可通过seg扩展,支持“float ranges”的索引</td>
</tr>
</tbody>
</table>
**Gin索引和Gist索引的区别:**
1. GIN索引查找比GiST索引更快、更精准
2. GIN索引的建立和更新比GIST索引耗时更长、占用空间更大
3. GIN索引对静态数据是最好的,因为查找速度很快。对于动态数据, GiST索引更新比较快。具体而言,GiST索引非常适合动态数据
- PHP
- PHP基础
- PHP介绍
- 如何理解PHP是弱类型语言
- 超全局变量
- $_SERVER详解
- 字符串处理函数
- 常用数组函数
- 文件处理函数
- 常用时间函数
- 日历函数
- 常用url处理函数
- 易混淆函数区别(面试题常见)
- 时间戳
- PHP进阶
- PSR规范
- RESTFUL规范
- 面向对象
- 三大基本特征和五大基本原则
- 访问权限
- static关键字
- static关键字
- 静态变量与普通变量
- 静态方法与普通方法
- const关键字
- final关键字
- abstract关键字
- self、$this、parent::关键字
- 接口(interface)
- trait关键字
- instanceof关键字
- 魔术方法
- 构造函数和析构函数
- 私有属性的设置获取
- __toString()方法
- __clone()方法
- __call()方法
- 类的自动加载
- 设计模式详解
- 关于设计模式的一些建议
- 工厂模式
- 简单工厂模式
- 工厂方法模式
- 抽象工厂模式
- 区别和适用范围
- 策略模式
- 单例模式
- HTTP
- 定义
- 特点
- 工作过程
- request
- response
- HTTP状态码
- URL
- GET和POST的区别
- HTTPS
- session与cookie
- 排序算法
- 冒泡排序算法
- 二分查找算法
- 直接插入排序算法
- 希尔排序算法
- 选择排序算法
- 快速排序算法
- 循环算法
- 递归与尾递归
- 迭代
- 日期相关的类
- DateTimeInterface接口
- DateTime类
- DateTimeImmutable类
- DateInterval类
- DateTimeZone类
- DatePeriod类
- format参数格式
- DateInterval的format格式化参数
- 预定义接口
- ArrayAccess(数组式访问)接口
- Serializable (序列化)接口
- Traversable(遍历)接口
- Closure类
- Iterator(迭代器)接口
- IteratorAggregate(聚合迭代器) 接口
- Generator (生成器)接口
- composer
- composer安装与使用
- python
- python3执行tarfile解压文件报错:tarfile.ReadError:file could not be opened successfully
- golang
- 单元测试
- 单元测试框架
- Golang内置testing包
- GoConvey库
- testify库
- 打桩与mock
- GoMock框架
- Gomonkey框架
- HTTP Mock
- httpMock
- mux库/httptest
- 数据库
- MYSQL
- SQL语言的分类
- 事务(重点)
- 索引
- 存储过程
- 触发器
- 视图
- 导入导出数据库
- 优化mysql数据库的方法
- MyISAM与InnoDB区别
- 外连接、内连接的区别
- 物理文件结构
- PostgreSQL
- 编译安装
- pgsql常用命令
- pgsql应用目录(bin目录)文件结构解析
- pg_ctl
- initdb
- psql
- clusterdb
- cluster命令
- createdb
- dropdb
- createuser
- dropuser
- pg_config
- pg_controldata
- pg_checksums
- pgbench
- pg_basebackup
- pg_dump
- pg_dumpall
- pg_isready
- pg_receivewal
- pg_recvlogical
- pg_resetwal
- pg_restore
- pg_rewind
- pg_test_fsync
- pg_test_timing
- pg_upgrade
- pg_verifybackup
- pg_archivecleanup
- pg_waldump
- postgres
- reindexdb
- vacuumdb
- ecpg
- pgsql数据目录文件结构解析
- pgsql数据目录文件结构解析
- postgresql.conf解析
- pgsql系统配置参数说明
- pgsql索引类型
- 四种索引类型解析
- 索引之ctid解析
- 索引相关操作
- pgsql函数解析
- pgsql系统函数解析
- pgsql窗口函数解析
- pgsql聚合函数解析
- pgsql系统表解析
- pg_stat_all_indexes
- pg_stat_all_tables
- pg_statio_all_indexes
- pg_statio_all_tables
- pg_stat_database
- pg_stat_statements
- pg_extension
- pg_available_extensions
- pg_available_extension_versions
- pgsql基本原理
- 进程和内存结构
- 存储结构
- 数据文件的内部结构
- 垃圾回收机制VACUUM
- 事务日志WAL
- 并发控制
- 介绍
- 事务ID-txid
- 元组结构-Tuple Structure
- 事务状态记录-Commit Log (clog)
- 事务快照-Transaction Snapshot
- 事务快照实例
- 事务隔离
- 事务隔离级别
- 读已提交-Read committed
- 可重复读-Repeatable read
- 可序列化-Serializable
- 读未提交-Read uncommitted
- 锁机制
- 扩展机制解析
- 扩展的定义
- 扩展的安装方式
- 自定义创建扩展
- 扩展的管理
- 扩展使用实例
- 在pgsql中使用last、first聚合函数
- pgsql模糊查询不走索引的解决方案
- pgsql的pg_trgm扩展解析与验证
- 高可用
- LNMP
- LNMP环境搭建
- 一键安装包
- 搭建方法
- 配置文件目录
- 服务器管理系统
- 宝塔(Linux)
- 安装与使用
- 开放API
- 自定义apache日志
- 一键安装包LNMP1.5
- LNMP1.5:添加、删除站点
- LNMP1.5:php多版本切换
- LNMP1.5 部署 thinkphp项目
- Operation not permitted解决方法
- Nginx
- Nginx的产生
- 正向代理和反向代理
- 负载均衡
- Linux常用命令
- 目录与文件相关命令
- 目录操作命令
- 文件编辑命令
- 文件查看命令
- 文件查找命令
- 文件权限命令
- 文件上传下载命令
- 用户和群组相关命令
- 用户与用户组的关系
- 用户相关的系统配置文件
- 用户相关命令
- 用户组相关命令
- 压缩与解压相关命令
- .zip格式
- .tar.gz格式
- .gz格式
- .bz2格式
- 查看系统版本
- cpuinfo详解
- meminfo详解
- getconf获取系统信息
- 磁盘空间相关命令
- 查看系统负载情况
- 系统环境变量
- 网络相关命令
- ip命令详解
- ip命令格式详解
- ip address命令详解
- ip link命令详解
- ip rule命令详解
- ip route命令详解
- nslookup命令详解
- traceroute命令详解
- netstat命令详解
- route命令详解
- tcpdump命令详解
- 系统进程相关命令
- ps命令详解
- pstree命令详解
- kill命令详解
- 守护进程-supervisord
- 性能监控相关命令
- top命令详解
- iostat命令详解
- pidstat命令详解
- iotop命令详解
- mpstat命令详解
- vmstat命令详解
- ifstat命令详解
- sar命令详解
- iftop命令详解
- 定时任务相关命令
- ssh登录远程主机
- ssh口令登录
- ssh公钥登录
- ssh带密码登录
- ssh端口映射
- ssh配置文件
- ssh安全设置
- 历史纪录
- history命令详解
- linux开启操作日志记录
- 拓展
- git
- git初始化本地仓库-https
- git初始化仓库-ssh
- git-查看和设置config配置
- docker
- 概念
- docker原理
- docker镜像原理
- docker Overlay2 文件系统原理
- docker日志原理
- docker日志驱动
- docker容器日志管理
- 原理论证
- 验证容器的启动是作为Docker Daemon的子进程
- 验证syslog类型日志驱动
- 验证journald类型日志驱动
- 验证local类型日志驱动
- 修改容器的hostname
- 修改容器的hosts
- 验证联合挂载技术
- 验证启动多个容器对于磁盘的占用情况
- 验证写时复制原理
- 验证docker内容寻址原理
- docker存储目录
- /var/lib/docker目录
- image目录
- overlay2目录
- 数据卷
- 具名挂载和匿名挂载
- 数据卷容器
- Dockerfile详解
- dockerfile指令详解
- 实例:构造centos
- 实例:CMD和ENTRYPOINT的区别
- docker网络详解
- docker-compose
- 缓存
- redis
- redis的数据类型和应用场景
- redis持久化
- RDB持久化
- AOF持久化
- redis缓存穿透、缓存击穿、缓存雪崩
- 常见网络攻击类型
- CSRF攻击
- XSS攻击
- SQL注入
- Cookie攻击
- 历史项目经验
- 图片上传项目实例
- 原生php上传方法实例
- base64图片流
- tp5的上传方法封装实例
- 多级关系的递归查询
- 数组转树结构
- thinkphp5.1+ajax实现导出Excel
- JS 删除数组的某一项
- 判断是否为索引数组
- ip操作