🔥码云GVP开源项目 12k star Uniapp+ElementUI 功能强大 支持多语言、二开方便! 广告
:-: ![](https://img.kancloud.cn/94/b3/94b3dcb41a0a173c4dc9c44ba9b0b0e4_1150x538.png) 文件存储格式比较 **存储格式选择:** 写:一般写入时间并不是最重要 读: 1、Avro——查询随时间变化的数据集 2、Parquet ——适合在宽表上查询少数列 3、Parquet & ORC以牺牲写性能为代价优化读取性能 4、TextFile读起来很慢 <br/> **Hive 查询(快->慢):** ``` ORC -> Parquet -> Text -> Avro -> SequenceFile ```