## Hadoop
> 提供分布式存储和计算
* 分布式存储:一个文件被分成很多块,并且以副本形式存储在各个节点中。
![](https://img.kancloud.cn/91/7a/917ae8d71948a8495b19e38d60203598_835x114.png)
## 核心组件 HDFS
> 将文件切分成指定大小的数据块,存储在不同机器上。
![](https://img.kancloud.cn/5a/9e/5a9e990981aef9ed0146b46965e4c82f_874x298.png)
## 核心组件 MapReduce
## 核心组件 YARN
![](https://img.kancloud.cn/5a/5c/5a5c63930aa1ef55ca603d3e57e34b55_927x521.png)
## Hadoop生态系统。
![](https://img.kancloud.cn/c9/d3/c9d3f94947482db0159f78c040eeb922_965x501.png)
## 发型版本的选择
![](https://img.kancloud.cn/db/e1/dbe1be30aa8b67b4575e640593b8ef5d_936x447.png)
> 大陆使用CHD比较多。建议使用。