多应用+插件架构,代码干净,二开方便,首家独创一键云编译技术,文档视频完善,免费商用码云13.8K 广告
列处理:在 SELECT 中,只拿需要的列,如果有,尽量使用分区过滤,少用`SELECT *`。 <br/> 行处理:在分区剪裁中,当使用外关联时,应尽量避免将副表的过滤条件写在 `where`后面,如果这样做就会先全表关联,之后才能过滤。 ```sql ### 比较下面两种查询方式的运行时间 (1)先关联两张表,再用副表的where 条件过滤 hive (default)> select o.id from bigtable b join ori o on o.id = b.id where o.id <= 10; Time taken: 63.316 seconds, Fetched: 100 row(s) (2)通过子查询后,再关联表 hive (default)> select b.id from bigtable b join (select id from ori where id <= 10 ) o on b.id = o.id; Time taken: 61.106 seconds, Fetched: 100 row(s) ```