有没有办法在R中进行部分字符串匹配?

问题描述 投票:-3回答:1

我有2个数据帧。首先有更多行和一个ID列“ALP23456”和其他相关列。第二行具有较少的行数,ID值作为注释“ALP23456在3月26日完成”。这是一个自由文本,没有模式可辨认。

问题:我想将数据框1中的ID列引用到数据框2文本列,以从数据框2中获取一些信息。面对问题,因为它不是完全匹配。

解决方案我想:

r string string-matching text-extraction
1个回答
0
投票

我使用了正则表达式并合并了两个数据帧,如下所示:

library(stringr)
library(dplyr)

df2$ID <- str_trim(str_extract(df2$Text, pattern = "Q\\S*|A\\S*"))
df <- left_join(df1, df2, by = "ID")
© www.soinside.com 2019 - 2024. All rights reserved.