如何联接Spark数据集A和B并标记A中未联接的记录?

问题描述 投票:-1回答:1

我有两个分别为TypeA和TypeB的数据集A和B。然后,我基于列(称为“键”)加入数据集,以获取数据集C。此后,我需要丢弃与B结合的数据集A中的事件,而仅保留A中无法结合的事件。我该怎么办?

apache-spark join apache-spark-dataset
1个回答
0
投票

您正在寻找的是左反联合。请查看此帖子以获取更多详细信息Left Anti join in Spark?

© www.soinside.com 2019 - 2024. All rights reserved.