我有2个数据帧。首先有更多行和一个ID列“ALP23456”和其他相关列。第二行具有较少的行数,ID值作为注释“ALP23456在3月26日完成”。这是一个自由文本,没有模式可辨认。
问题:我想将数据框1中的ID列引用到数据框2文本列,以从数据框2中获取一些信息。面对问题,因为它不是完全匹配。
解决方案我想:
我使用了正则表达式并合并了两个数据帧,如下所示:
library(stringr)
library(dplyr)
df2$ID <- str_trim(str_extract(df2$Text, pattern = "Q\\S*|A\\S*"))
df <- left_join(df1, df2, by = "ID")