028-86922220

建站动态

根据您的个性需求进行定制 先人一步 抢占小程序红利时代

troubleshootingshufflereduce端缓冲大小怎么避免OOM

这篇文章主要讲解了“troubleshooting shuffle reduce端缓冲大小怎么避免OOM”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“troubleshooting shuffle reduce端缓冲大小怎么避免OOM”吧!

广安ssl适用于网站、小程序/APP、API接口等需要进行数据传输应用场景,ssl证书未来市场广阔!成为创新互联的ssl证书销售渠道,可以享受市场价格4-6折优惠!如果有意向欢迎电话联系或者加微信:18980820575(备注:SSL证书合作)期待与您的合作!

        map端的task是不断的输出数据的,数据量可能是很大的。但是,其实reduce端的task,并不是等到map端task将属于自己的那份数据全部写入磁盘文件之后,再去拉取的。map端写一点数据,reduce端task就会拉取一小部分数据,立即进行后面的聚合、算子函数的应用。

        每次reduece能够拉取多少数据,就由buffer来决定。因为拉取过来的数据,都是先放在buffer中的。然后才用后面的executor分配的堆内存占比(0.2),hashmap,去进行后续的聚合、函数的执行。

reduce端缓冲(buffer),可能会出什么问题?

针对上述的可能出现的问题,我们该怎么来解决呢?

再来说说,reduce端缓冲大小的另外一面,关于性能调优的一面:

一定要注意,资源足够的时候,再去做这个事儿。

spark.reducer.maxSizeInFlight,48
spark.reducer.maxSizeInFlight,24

感谢各位的阅读,以上就是“troubleshooting shuffle reduce端缓冲大小怎么避免OOM”的内容了,经过本文的学习后,相信大家对troubleshooting shuffle reduce端缓冲大小怎么避免OOM这一问题有了更深刻的体会,具体使用情况还需要大家实践验证。这里是创新互联,小编将为大家推送更多相关知识点的文章,欢迎关注!


网站栏目:troubleshootingshufflereduce端缓冲大小怎么避免OOM
文章转载:http://www.tsicrk.com/article/pdhdjo.html

其他资讯

让你的专属顾问为你服务

1.6270s