Apache Spark 2.4:为什么会有“不广播”?

问题描述 投票:-1回答:1

我已使用]配置了spark-submit,>

“-conf”,“ spark.sql.autoBroadcastJoinThreshold = 536870912”,512MB

但是DAG仍未广播连接的较小端。

该代码是一个简单的联接。所以我想知道哪里出了问题。

输入是镶木地板文件,存储在S3上。

如果需要更多信息以进行进一步分析,请告诉我。

enter image description here

我已使用“ --conf”,“ spark.sql.autoBroadcastJoinThreshold = 536870912”,512MB配置了spark-submit,但是DAG仍未广播该联接的较小端。 ...

performance apache-spark bigdata broadcast
1个回答
0
投票

我的猜测是配置spark.sql.autoBroadcastJoinThreshold

© www.soinside.com 2019 - 2024. All rights reserved.