“`” hadoop:map端保存分片数据,通过网络收集到reduce端 spark:spark的shuffle是在DAGSchedular划分Stage的时候产生的,TaskSchedule要分发Stage到各个worker的executor 减少shuffle可以提高性能 <pre><code> "“` Was this helpful? YesNo 0 / 0 上一篇: Hive中存放是什么? 下一篇: map-reduce程序运行的时候会有什么比较常见的问题 发表回复 取消回复0 Your email address will not be published. 在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。