我想在匹配的列名称上组合两个数据框。但是,在最新数据中,某些列名称的拼写略有不同。如果我能够以一定百分比的可能性匹配名称,我就可以创建一个包含所有数据的数据框。
有什么想法要使用什么包或从哪里开始吗?
看起来您需要一个“模糊”连接,即不完美匹配的连接。看一下
fuzzyjoin