用于字符串操作的R包。
Base R Regex中的正则表达式,用于标识电子邮件地址
我正在尝试使用stringr库从一个大而混乱的文件中提取电子邮件。 str_match不允许perl = TRUE,我无法找出转义符来使其工作。有人可以......
我需要编写一个列,其中包含另一个表中的值。这是一个最小的数据示例:data1
我有一个使用readtext()创建的数据框。它有两列:doc_id,text。对于每一行(doc_id),我想在两个字符串之间提取一个子字符串(在我的情况下是政府部门的名称)...
我想使用str_detect而不是将“”转换为另一个字符串模式。有没有一种简单的方法来处理现在生成警告的空字符串模式“”。我想这个......
我有一个词,并希望在R中输出所有可能的偏差(替换,替换,插入),将固定距离值输入到矢量中。例如,单词“Cat”和固定距离值......
如何在管道的第n和第n + 1次出现之间匹配?在字符串abc | def | ghi | jkl中我想匹配ghi。我最好的尝试是str_match_all('abc | def | ghi | jkl','((?<= \\ |)[...
我试图使用正则表达式和str_replace_all标准化一些奇数字符串数据。在某些情况下,我想使用字符集(例如[abc])或“通配符”(例如\ d)来定位字符...
我似乎没有看到paste / paste0和str_c之间的区别,用于将单个向量组合成单个字符串,将多个字符串组合成一个字符串,或将多个向量组合成单个字符串。当我 ...
这是文本:data $ charge [1] [1]“Count#1 as Filed:In Violation of; 21 OS 645; Count#2 as Filed:In Violation of; 21 OS 1541.1; Docket 1”我正在尝试从...中提取法规
R - 为什么str_detect在使用以dash结尾的'words'上使用单词边界时返回与grepl不同的结果
str_detect的帮助页面指出“等效于grepl(pattern,x)”,但是:str_detect(“ALL”,str_c(“\\ b”,“ALL”,“\\ b”))[1] FALSE而grepl(str_c(“\\ b”,“所有”,“\\ b”),“所有”)[1] TRUE ...
我正在尝试在R中协调我的df。我有一个使用不同格式填充的列,例如:ID值1第一个值在5'= 9 ||第二个值在20'= 8 2第一...
是否有更快的替代方法来计算R中100,000个短字符串的特殊字符?
我试图计算100,000个字符串向量中每个字符串的非字母数字字符数。我发现我当前的实现速度比我想要的慢。我现在......
考虑这个简单的正则表达式旨在提取标题(\ w [\ w - ] +){2,}在Python(Pandas)与R(stringr)中运行它会产生完全不同的结果!在stringr中,提取工作正常:请参阅...
在R中导入多个发票(.PDF)。将它们从字符串转换为tibble
所以我正在做一个项目,我需要将大量的.pdfs加载到R中。这部分内容有所涉及。问题是当将pdfs导入R时,每一行都是一个字符串。不是所有......
我正在检测报告中的子字符串,然后根据子字符串是否存在而在报告的末尾添加后缀字。较短的单词是危险的,因为它们通常是部分......
我想在每个标题之前分割这个文本(这里只是一个例子)。标题由前面有5个\ n的物种的拉丁名称定义(例如,\ n \ n \ n \ n \ n \ n \ nAcampe carinata(Griff。))。文字......
几乎所有来自stringr包的帮助文件都包含此行匹配固定字符串(即通过仅比较字节),使用fixed()。这很快,但近似。一般来说,匹配......
我有一个变量列,其中包含多个字符串的大字符串值。我想创建一个True / False列,如果在...列中检测到某个值,则报告为true
我正在设置一个数据表,并希望将所有数据转换为小写,认为它看起来很整洁。我怎样才能做到这一点 ?