“`” 参考回答: 避免创建重复的RDD,尽量复用同一RDD,尽量避免使用shuffle类算子,优化数据结构,使用Hive ETL预处理数据,过滤少数导致倾斜的key,提高shuffle操作的并行度,两阶段聚合,将reduce join转为map join。 <pre><code> "“` Was this helpful? YesNo 0 / 0 上一篇: map reduce实现笛卡尔乘积? 下一篇: 请你来说一下Redis和memcached的区别 发表回复 取消回复0 Your email address will not be published. 在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。