🔥码云GVP开源项目 12k star Uniapp+ElementUI 功能强大 支持多语言、二开方便! 广告
**1. 空key过滤** 如果某些key对应的数据太多,相同的key的数据会发送到同一个reduce端,从而可能会导致内存不够。 <br/> 我们可以仔细分析这些异常的key,很多情况下,这些key对应的是异常数据,我们需要早HQL语句中对其过滤。 <br/> **2. 空key转换** 有时虽然某个key为空对应的数据很多,但不是异常数据,此时我们可以为表中的空key字段赋值为随机值,从而让数据随机均匀地分布到不同的reducer上。