Welcome to the Hadoop installed wiki!
以下是相关资料
[搭建hadoop-2.6.0-cdh5.4.7伪分布式](https://blog.liyang.io/108.html)
[apache hadoop-2.6.0-CDH5.4.1 安装:完全分布式](http://blog.csdn.net/yew1eb/article/details/45790483)
[官网:Hadoop分布式文件系统:架构和设计](http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_design.html)
[Yarn 和MapReduce比较](http://www.aboutyun.com/thread-7678-1-1.html)
[HBase 默认配置](http://blog.csdn.net/qq_20641565/article/details/54408279)
[基于CDH5.4.5(ha)的Hbase 3节点搭建](http://blog.csdn.net/qq_20641565/article/details/54410271)
[分布式系统概述(Hadoop与HBase的前生今世)](http://blog.csdn.net/pirateleo/article/details/8426736)
[HBase介绍、搭建、环境、安装部署:架构、数据结构、原理](http://www.cnblogs.com/oraclestudy/articles/5665780.html)
[zk的作用及spark](http://blog.csdn.net/dream_an/article/details/52089883)
[HBase之单机模式与伪分布式模式安装](http://blog.csdn.net/andie_guo/article/details/44086389)
HBase命令及数据结构//TODO
## HBase
- HMaster的作用:
为Region server分配region
负责Region server的负载均衡
发现失效的Region server并重新分配其上的region
HDFS上的垃圾文件回收
处理schema更新请求
- HRegionServer作用:
维护master分配给他的region,处理对这些region的io请求
负责切分正在运行过程中变的过大的region
可以看到,client访问HBase上的数据并不需要master参与(寻址访问zookeeper和region server,数据读写访问region server),master仅仅维护table和region的元数据信息(table的元数据信息保存在zookeeper上),负载很低。
HRegionServer存取一个子表时,会创建一个HRegion对象,然后对表的每个列族创建一个Store实例,每个Store都会有一个MemStore和0个或多个StoreFile与之对应,每个StoreFile都会对应一个HFile, HFile就是实际的存储文件。因此,一个HRegion有多少个列族就有多少个Store。
一个HRegionServer会有多个HRegion和一个HLog。
- 在看的书和文章
- Java程序员手册
- 思维方式
- 面向服务
- Dubbo
- StringBoot
- 001.应用部署
- 002.注解学习
- SpringCloud
- SpringCloud入门
- Dbs
- 分布式
- Ffp
- 多线程
- 多线程小知识
- Java锁认识
- Netty
- Netty学习目录
- 读写事件流程分析与相关API
- 数据
- 大数据学习
- 学习目录
- Hadoop学习
- Hadoop组建安装
- ssh配置免密登陆
- Hadoop伪集群模式
- HBase伪集群模式
- Hive安装
- 常用操作命令
- 问题记录
- DOLIST
- 学习资料
- Spark
- 一些概念介绍
- 数据库
- Oracle相关
- 批量测试数据生成
- MySQL相关
- Redis
- 常用操作
- 机器学习
- 认识
- Kafka
- 监控
- 分布式相关
- RPC
- 中间件
- ElasticSearch
- ES环境搭建
- Python客户端创建索引
- Es的api常用操作
- SQL查询引擎
- Es数DB的数据同步
- ActiveMQ
- ActiveMQ介绍
- 分享
- Skyeye
- 组件安装配置
- Dubbo服务Demo应用部署
- Kafka安装配置
- RabbitMq配置
- Docker
- Docker学习文章
- Docker的大数据平台之路
- Docker环境搭建
- ubuntu16安装docker
- Docker镜像加速
- 使用Docker快速搭建中间件
- Docker环境使用mysql
- Docker环境的中间件搭建汇总
- Docker镜像容器管理
- Docker镜像创建
- Docker创建可用的系统容器
- Kubernetes
- etcd安装
- flanneld安装
- kubernetes环境安装
- kubernetes源码编译
- Linux相关
- Linux操作系统
- Deepin操作系统
- 新系统环境准备
- Linux系统小工具
- Linxu配置时间服务器同步
- DNS服务器dnsmasq
- Linux命令
- 常用命令
- 计算机基础
- README
- 数据结构
- 面试题总结
- 计算机组层原理
- 计算机组层原理
- 其它语言
- Python
- Python环境搭建
- Python学习总结
- Python语法学习
- Python模块学习
- MySQLdb
- scrapy
- Python的exception
- PythonNLP入门
- Go
- 工具组件
- Jenkins
- Jenkins认识
- Jenkins安装配置
- Jenkins插件使用
- Jenkins项目常用配置
- Git
- Git使用说明
- NLP
- 入门级别
- 一些概念
- faiss介绍
- WMD介绍