[TOC]
## 一 分片集概念
### A 分片概述
分片(sharding)是指将数据库拆分,将其分散在不同的机器上的过程。
分片集群(sharded cluster)是一种水平扩展数据库系统性能的方法,能够将数据集分布式存储在不同的分片(shard)上,每个分片只保存数据集的一部分,MongoDB保证各个分片之间不会有重复的数据,所有分片保存的数据之和就是完整的数据集。
分片集群将数据集分布式存储,能够将负载分摊到多个分片上,每个分片只负责读写一部分数据,充分利用了各个shard的系统资源,提高数据库系统的吞吐量
mongodb3.2版本后,分片技术必须结合复制集完成
**应用场景:**
1. 单台机器的磁盘不够用了,使用分片解决磁盘空间的问题
2. 单个mongod已经不能满足写数据的性能要求。通过分片让写压力分散到各个分片上面,使用分片服务器自身的资源
3. 想把大量数据放到内存里提高性能。和上面一样,通过分片使用分片服务器自身的资源
### B 分片存储原理
![分片存储原理](https://s2.ax1x.com/2019/12/12/Qy0c7Q.png)
**存储方式:**
* 数据集被拆分成数据块(chunk),每个数据块包含多个doc,数据块分布式存储在分片集群中
**角色:**
* Config server
1.存储节点信息
2.存储分片策略
3.记录数据存储的位置
* Shard server
将数据进行分片,拆分成数据块(chunk),数据块真正存放的单位
* Mongos server
1.接收用户请求,返回用户数据
2.读取config server,获取分片策略和节点信息
3.根据分片策略路由请求和获取数据
4.自动均衡数据chunk
**总结:**
应用请求mongos来操作mongodb的增删改查,配置服务器存储数据库元信息,并且和mongos做同步,数据最终存入在shard(分片)上,为了防止数据丢失,同步在副本集中存储了一份,仲裁节点在数据存储到分片的时候决定存储到哪个节点
### C 分片语法和分片类型
**片键类型**
片键是文档的一个属性字段或是一个复合索引字段,一旦建立后则不可改变,片键是拆分数据的关键的依据
在数据极为庞大的场景下,片键决定了数据在分片的过程中数据的存储位置,直接会影响集群的性能
创建片键时,需要有一个支撑片键运行的索引
**语法解析:**
~~~
mongos> use 库名
mongos> db.集合名.ensureIndex({"键名":1}) ##创建索引
mongos> sh.enableSharding("库名") ##开启库的分片
mongos> sh.shardCollection("库名.集合名",{"键名":1}) ##开启集合的分片并指定片键
~~~
**片键分类:**
1. 递增片键
使用时间戳,日期,自增的主键,ObjectId,\_id等,此类片键的写入操作集中在一个分片服务器上,写入不具有分散性,这会导致单台服务器压力较大,但分割比较容易,这台服务器可能会成为性能瓶颈
```sh
> db.bar.ensureIndex({"timestamp":1})
> sh.enableSharding("foo")
> sh.shardCollection("foo.bar",{""timestamp":1})
```
2. 哈希片键
也称之为散列索引,使用一个哈希索引字段作为片键,优点是使数据在各节点分布比较均匀,数据写入可随机分发到每个分片服务器上,把写入的压力分散到了各个服务器上。但是读也是随机的,可能会命中更多的分片,但是缺点是无法实现范围区分
```sh
> db.bar.ensureIndex({"files_id":"hashed"})
> sh.enableSharding("foo")
> sh.shardCollection("foo.fs.chunks",{"files_id":"hashed"})
```
3. 组合片键
数据库中没有比较合适的键值供片键选择,或者是打算使用的片键基数太小(即变化少如星期只有7天可变化),可以选另一个字段使用组合片键,甚至可以添加冗余字段来组合
```sh
> sh.enableSharding("foo")
> sh.shardCollection("foo.fs.chunks",{"files_id":1,"n":1})
```
4. 标签片键
数据存储在指定的分片服务器上,可以为分片添加tag标签,然后指定相应的tag
比如让`0-1999`出现在shard0000上,`2000-9999`出现在shard0001或shard0002上,就可以使用tag让均衡器指定分发
```sh
> sh.addShardTag("shard0000","T");
> sh.addShardTag("shard0001","Q");
> sh.addShardTag("shard0002","Q");
> sh.addTagRange("foo.ids",{"id":0},{"id":1999},"T");
> sh.addTagRange("foo.ids",{"id":2000},{"id":9999},"Q");
```
## 二 分片集群搭建
### A 集群规划和目录创建
单机启动10个mongodb实例,端口为38030-38039,其中
1. configserver:
3台构成的复制集,1主两从,不支持arbiter
复制集名字:configsvr
端口范围:38031-38033
2. shard节点:
sh1:38034-36(1主1从1个arbiter)
sh2:38037-39(1主1从1个arbiter)
3. mongos节点
38030单节点节点
创建目录
```
mkdir -p /opt/mongodb/2803{0,1,2,3,4,5,6,7,8,9}/{conf,data,log}
```
### B configserver复制集群准备
**准备configserver配置文件**
```sh
[mongo@noah ~]$ vim /opt/mongodb/28031/conf/mongod.conf
systemLog:
destination: file
path: /opt/mongodb/38031/log/mongodb.log
logAppend: true
storage:
journal:
enabled: true
dbPath: /opt/mongodb/38031/data
directoryPerDB: true
wiredTiger:
engineConfig:
cacheSizeGB: 1
directoryForIndexes: true
collectionConfig:
blockCompressor: zlib
indexConfig:
prefixCompression: true
processManagement:
fork: true
net:
port: 38031
replication:
oplogSizeMB: 2048
replSetName: configReplSet
sharding:
clusterRole: configsvr
```
**复制配置文件为多份**
```sh
cp /opt/mongodb/2803{1,2}/conf/mongod.conf
cp /opt/mongodb/2803{1,3}/conf/mongod.conf
```
**修改配置文件端口**
```sh
sed -i 's#28031#28032#g' /opt/mongodb/28032/conf/mongod.conf
sed -i 's#28031#28033#g' /opt/mongodb/28033/conf/mongod.conf
```
### C shard复制集群准备
**准备shard配置文件**
```sh
[mongo@noah ~]$ vim /opt/mongodb/28034/conf/mongod.conf
systemLog:
destination: file
path: /opt/mongodb/38034/log/mongodb.log
logAppend: true
storage:
journal:
enabled: true
dbPath: /opt/mongodb/38034/data
directoryPerDB: true
wiredTiger:
engineConfig:
cacheSizeGB: 1
directoryForIndexes: true
collectionConfig:
blockCompressor: zlib
indexConfig:
prefixCompression: true
processManagement:
fork: true
net:
port: 38034
replication:
oplogSizeMB: 2048
replSetName: sh1
sharding:
clusterRole: shardsvr
```
**复制配置文件为多份**
```sh
cp /opt/mongodb/2803{4,5}/conf/mongod.conf
cp /opt/mongodb/2803{4,6}/conf/mongod.conf
cp /opt/mongodb/2803{4,7}/conf/mongod.conf
cp /opt/mongodb/2803{4,8}/conf/mongod.conf
cp /opt/mongodb/2803{4,9}/conf/mongod.conf
```
**修改sh1集群配置文件端口**
```sh
sed -i 's#28034#28035#g' /opt/mongodb/28035/conf/mongod.conf
sed -i 's#28034#28036#g' /opt/mongodb/28036/conf/mongod.conf
```
**修改sh2集群配置文件端口和集群名**
```sh
sed -i -e 's#28034#28037#g' -e 's#sh1#sh2#g' /opt/mongodb/28037/conf/mongod.conf
sed -i -e 's#28034#28038#g' -e 's#sh1#sh2#g' /opt/mongodb/28038/conf/mongod.conf
sed -i -e 's#28034#28039#g' -e 's#sh1#sh2#g' /opt/mongodb/28039/conf/mongod.conf
```
### D 启动实例并启动复制集
**启动所有实例**
```sh
mongod -f /opt/mongodb/38031/conf/mongodb.conf
mongod -f /opt/mongodb/38032/conf/mongodb.conf
mongod -f /opt/mongodb/38033/conf/mongodb.conf
mongod -f /opt/mongodb/38034/conf/mongodb.conf
mongod -f /opt/mongodb/38035/conf/mongodb.conf
mongod -f /opt/mongodb/38036/conf/mongodb.conf
mongod -f /opt/mongodb/38037/conf/mongodb.conf
mongod -f /opt/mongodb/38038/conf/mongodb.conf
```
**configserver集群搭建**
```sh
mongo --port 38030 admin
config = {_id: 'configReplSet', members: [
{_id: 0, host: '10.0.0.11:38030'},
{_id: 1, host: '10.0.0.11:38031'},
{_id: 2, host: '10.0.0.11:38032'}]
}
rs.initiate(config)
```
**sh1复制集构建:**
```sh
mongo --port 38033
admin
config = {_id: 'sh1', members: [
{_id: 0, host: '10.0.0.11:38033'},
{_id: 1, host: '10.0.0.11:38034'},
{_id: 2, host: '10.0.0.11:38035',"arbiterOnly":true}]
}
rs.initiate(config)
```
**sh2复制集构建:**
```sh
mongo --port 38036 admin
config = {_id: 'sh1', members: [
{_id: 0, host: '10.0.0.11:38036'},
{_id: 1, host: '10.0.0.11:38037'},
{_id: 2, host: '10.0.0.11:38038',"arbiterOnly":true}]
}
rs.initiate(config)
```
## 三 分片集群配置
### A 配置并启动mongos
节点配置
```sh
[mongo@noah ~]$ vim /opt/mongodb/38030/conf/mongos.conf
systemLog:
destination: file
path: /opt/mongodb/38030/log/mongos.log
logAppend: true
net:
port: 38030
sharding:
configDB: configReplSet/10.0.0.11:38031,10.0.0.11:38032,10.0.0.11:38033
processManagement:
fork: true
```
启动mongos
```sh
mongod -f /opt/mongodb/38030/conf/mongodb.conf
```
### B 配置分片集群
**连接到mongs的admin数据库**
```sh
mongo 10.0.0.11:38030/admin
```
**添加分片**
```sh
db.runCommand( { addshard : "sh1/10.0.0.11:38034,10.0.0.11:38035,10.0.0.11:38036",name:"shard1"} )
db.runCommand( { addshard : "sh2/10.0.0.11:38037,10.0.0.11:38038,10.0.0.11:38039",name:"shard2"} )
```
**列出分片**
```sh
mongos> db.runCommand( { listshards : 1 } )
```
**整体状态查看**
```sh
mongos> sh.status();
```
## 四 使用分片集群
### A Hash分片配置及测试:
例子:对noah库下的vast大表进行hash
1. 对于noah开启分片功能
```sh
mongo --port 38030 admin
use admin
admin> db.runCommand( { enablesharding : "noah" } )
```
2. 对于noah库下的vast表建立hash索引
```sh
use noah
noah> db.vast.ensureIndex( { id: "hashed" } )
```
3. 开启分片
```sh
use admin
admin > sh.shardCollection( "noah.vast", { id: "hashed" } )
```
4. 录入10w行数据测试
```sh
use noah
for(i=1;i<100000;i++){ db.vast.insert({"id":i,"name":"luogang","age":70,"date":new Date()}); }
```
5. hash分片结果测试
```sh
mongo --port 38034
use noah
db.vast.count();
mongo --port 38037
use noah
db.vast.count();
```
### B RANGE分片配置及测试
例子:test库下的vast大表进行手工分片
1. 激活数据库分片功能
```sh
mongo --port 38030 admin
> db.runCommand( { enablesharding : "test" } )
```
2. 创建索引
```sh
use test
> db.vast.ensureIndex( { id: 1 } )
```
3. 开启分片
```sh
use admin
> sh.shardcollection("test.vast", {id: 1} } )
```
4. 集合分片验证
```sh
admin> use test
test> for(i=1;i<500000;i++){ db.vast.insert({"id":i,"name":"shenzheng","age":70,"date":new Date()}); }
test> db.vast.stats()
```
5. 分片结果测试
```sh
shard1:
mongo --port 38034
db.vast.count();
shard2:
mongo --port 38037
db.vast.count();
```
- shell编程
- 变量1-规范-环境变量-普通变量
- 变量2-位置-状态-特殊变量
- 变量3-变量子串
- 变量4-变量赋值三种方法
- 变量5-数组相关
- 计算1-数值计算命令和案例
- 计算2-expr命令举例
- 计算3-条件表达式和各种操作符
- 计算4-条件表达式和操作符案例
- 循环1-函数的概念与作用
- 循环2-if与case语法
- 循环3-while语法
- 循环4-for循环
- 其他1-判断传入的参数为0或整数的多种思路
- 其他2-while+read按行读取文件
- 其他3-给输出内容加颜色
- 其他4-shell脚本后台运行知识
- 其他5-6种产生随机数的方法
- 其他6-break,continue,exit,return区别
- if语法案例
- case语法案例
- 函数语法案例
- WEB服务软件
- nginx相关
- 01-简介与对比
- 02-日志说明
- 03-配置文件和虚拟主机
- 04-location模块和访问控制
- 05-status状态模块
- 06-rewrite重写模块
- 07-负载均衡和反向代理
- 08-反向代理监控虚拟IP地址
- nginx与https自签发证书
- php-nginx-mysql联动
- Nginx编译安装[1.12.2]
- 案例
- 不同客户端显示不同信息
- 上传和访问资源池分离
- 配置文件
- nginx转发解决跨域问题
- 反向代理典型配置
- php相关
- C6编译安装php.5.5.32
- C7编译php5
- C6/7yum安装PHP指定版本
- tomcxat相关
- 01-jkd与tomcat部署
- 02-目录-日志-配置文件介绍
- 03-tomcat配置文件详解
- 04-tomcat多实例和集群
- 05-tomcat监控和调优
- 06-Tomcat安全管理规范
- show-busy-java-threads脚本
- LVS与keepalived
- keepalived
- keepalived介绍和部署
- keepalived脑裂控制
- keepalived与nginx联动-监控
- keepalived与nginx联动-双主
- LVS负载均衡
- 01-LVS相关概念
- 02-LVS部署实践-ipvsadm
- 03-LVS+keepalived部署实践
- 04-LVS的一些问题和思路
- mysql数据库
- 配置和脚本
- 5.6基础my.cnf
- 5.7基础my.cnf
- 多种安装方式
- 详细用法和命令
- 高可用和读写分离
- 优化和压测
- docker与k8s
- docker容器技术
- 1-容器和docker基础知识
- 2-docker软件部署
- 3-docker基础操作命令
- 4-数据的持久化和共享互连
- 5-docker镜像构建
- 6-docker镜像仓库和标签tag
- 7-docker容器的网络通信
- 9-企业级私有仓库harbor
- docker单机编排技术
- 1-docker-compose快速入门
- 2-compose命令和yaml模板
- 3-docker-compose命令
- 4-compose/stack/swarm集群
- 5-命令补全和资源限制
- k8s容器编排工具
- mvn的dockerfile打包插件
- openstack与KVM
- kvm虚拟化
- 1-KVM基础与快速部署
- 2-KVM日常管理命令
- 3-磁盘格式-快照和克隆
- 4-桥接网络-热添加与热迁移
- openstack云平台
- 1-openstack基础知识
- 2-搭建环境准备
- 3-keystone认证服务部署
- 4-glance镜像服务部署
- 5-nova计算服务部署
- 6-neutron网络服务部署
- 7-horizon仪表盘服务部署
- 8-启动openstack实例
- 9-添加计算节点流程
- 10-迁移glance镜像服务
- 11-cinder块存储服务部署
- 12-cinder服务支持NFS存储
- 13-新增一个网络类型
- 14-云主机冷迁移前提设置
- 15-VXALN网络类型配置
- 未分类杂项
- 部署环境准备
- 监控
- https证书
- python3.6编译安装
- 编译安装curl[7.59.0]
- 修改Redhat7默认yum源为阿里云
- 升级glibc至2.17
- rabbitmq安装和启动
- rabbitmq多实例部署[命令方式]
- mysql5.6基础my.cnf
- centos6[upstart]/7[systemd]创建守护进程
- Java启动参数详解
- 权限控制方案
- app发包仓库
- 版本发布流程
- elk日志系统
- rsyslog日志统一收集系统
- ELK系统介绍及YUM源
- 快速安装部署ELK
- Filebeat模块讲解
- logstash的in/output模块
- logstash的filter模块
- Elasticsearch相关操作
- ES6.X集群及head插件
- elk收集nginx日志(json格式)
- kibana说明-汉化-安全
- ES安装IK分词器
- zabbix监控
- zabbix自动注册模板实现监控项自动注册
- hadoop大数据集群
- hadoop部署
- https证书
- certbot网站
- jenkins与CI/CD
- 01-Jenkins部署和初始化
- 02-Jenkins三种插件安装方式
- 03-Jenkins目录说明和备份
- 04-git与gitlab项目准备
- 05-构建自由风格项目和相关知识
- 06-构建html静态网页项目
- 07-gitlab自动触发项目构建
- 08-pipelinel流水线构建项目
- 09-用maven构建java项目
- iptables
- 01-知识概念
- 02-常规命令实战
- 03-企业应用模板
- 04-企业应用模板[1键脚本]
- 05-企业案例-共享上网和端口映射
- SSH与VPN
- 常用VPN
- VPN概念和常用软件
- VPN之PPTP部署[6.x][7.x]
- 使用docker部署softether vpn
- softEther-vpn静态路由表推送
- SSH服务
- SSH介绍和部署
- SSH批量分发脚本
- 开启sftp日志并限制sftp访问目录
- sftp账号权限分离-开发平台
- ssh配置文件最佳实践
- git-github-gitlab
- git安装部署
- git详细用法
- github使用说明
- gitlab部署和使用
- 缓存数据库
- zookeeper草稿
- mongodb数据库系列
- mongodb基本使用
- mongodb常用命令
- MongoDB配置文件详解
- mongodb用户认证管理
- mongodb备份与恢复
- mongodb复制集群
- mongodb分片集群
- docker部署mongodb
- memcached
- memcached基本概念
- memcached部署[6.x][7.x]
- memcached参数和命令
- memcached状态和监控
- 会话共享和集群-优化-持久化
- memcached客户端-web端
- PHP测试代码
- redis
- 1安装和使用
- 2持久化-事务-锁
- 3数据类型和发布订阅
- 4主从复制和高可用
- 5redis集群
- 6工具-安全-pythonl连接
- redis配置文件详解
- 磁盘管理和存储
- Glusterfs分布式存储
- GlusterFS 4.1 版本选择和部署
- Glusterfs常用命令整理
- GlusterFS 4.1 深入使用
- NFS文件存储
- NFS操作和部署
- NFS文件系统-挂载和优化
- sersync与inotify
- rsync同步服务
- rsyncd.conf
- rsync操作和部署文档
- rsync常见错误处理
- inotify+sersync同步服务
- inotify安装部署
- inotify最佳脚本
- sersync安装部署
- 时间服务ntp和chrony
- 时间服务器部署
- 修改utc时间为cst时间
- 批量操作与自动化
- cobbler与kickstart
- KS+COBBLER文件
- cobbler部署[7.x]
- kickstart部署[7.x]
- kickstar-KS文件和语法解析
- kickstart-PXE配置文件解析
- 自动化之ansible
- ansible部署和实践
- ansible剧本编写规范
- 配置文件示例
- 内网DNS服务
- 压力测试
- 压测工具-qpefr测试带宽和延时