我有两个分别为TypeA和TypeB的数据集A和B。然后,我基于列(称为“键”)加入数据集,以获取数据集C。此后,我需要丢弃与B结合的数据集A中的事件,而仅保留A中无法结合的事件。我该怎么办?
您正在寻找的是左反联合。请查看此帖子以获取更多详细信息Left Anti join in Spark?