stringr 相关问题

用于字符串操作的R包。

Base R Regex中的正则表达式,用于标识电子邮件地址

我正在尝试使用stringr库从一个大而混乱的文件中提取电子邮件。 str_match不允许perl = TRUE,我无法找出转义符来使其工作。有人可以......

回答 3 投票 2

在数据框上,如果它们存在于另一个数据框中,则重复值

我需要编写一个列,其中包含另一个表中的值。这是一个最小的数据示例:data1

回答 3 投票 2

提取两个重复字符串之间的文本子串

我有一个使用readtext()创建的数据框。它有两列:doc_id,text。对于每一行(doc_id),我想在两个字符串之间提取一个子字符串(在我的情况下是政府部门的名称)...

回答 3 投票 2

在字符串检测中处理空字符串

我想使用str_detect而不是将“”转换为另一个字符串模式。有没有一种简单的方法来处理现在生成警告的空字符串模式“”。我想这个......

回答 4 投票 4

如何在R中输出一个字的固定距离值的所有可能的偏差?

我有一个词,并希望在R中输出所有可能的偏差(替换,替换,插入),将固定距离值输入到矢量中。例如,单词“Cat”和固定距离值......

回答 1 投票 1

在R stringr中第n次出现后匹配

如何在管道的第n和第n + 1次出现之间匹配?在字符串abc | def | ghi | jkl中我想匹配ghi。我最好的尝试是str_match_all('abc | def | ghi | jkl','((?<= \\ |)[...

回答 2 投票 -1

在R中的其他两个字符串之间提取字符串

我试图找到一种简单的方法来提取出现在两个已知子串之间的未知子串(可能是任何东西)。例如,我有一个字符串:a

回答 3 投票 18

如何使用str_replace只替换正则表达式中的一个字符

我试图使用正则表达式和str_replace_all标准化一些奇数字符串数据。在某些情况下,我想使用字符集(例如[abc])或“通配符”(例如\ d)来定位字符...

回答 2 投票 0

paste / paste0和str_c有什么区别?

我似乎没有看到paste / paste0和str_c之间的区别,用于将单个向量组合成单个字符串,将多个字符串组合成一个字符串,或将多个向量组合成单个字符串。当我 ...

回答 1 投票 3

如何将str_extract_all转换为多个列

这是文本:data $ charge [1] [1]“Count#1 as Filed:In Violation of; 21 OS 645; Count#2 as Filed:In Violation of; 21 OS 1541.1; Docket 1”我正在尝试从...中提取法规

回答 3 投票 0

R - 为什么str_detect在使用以dash结尾的'words'上使用单词边界时返回与grepl不同的结果

str_detect的帮助页面指出“等效于grepl(pattern,x)”,但是:str_detect(“ALL”,str_c(“\\ b”,“ALL”,“\\ b”))[1] FALSE而grepl(str_c(“\\ b”,“所有”,“\\ b”),“所有”)[1] TRUE ...

回答 1 投票 4

如何使用字符串和数字( 仅获取数字)来协调数据框中的列?

我正在尝试在R中协调我的df。我有一个使用不同格式填充的列,例如:ID值1第一个值在5'= 9 ||第二个值在20'= 8 2第一...

回答 1 投票 0

是否有更快的替代方法来计算R中100,000个短字符串的特殊字符?

我试图计算100,000个字符串向量中每个字符串的非字母数字字符数。我发现我当前的实现速度比我想要的慢。我现在......

回答 1 投票 2

相同的正则表达式但在Pandas vs. R中的结果不同

考虑这个简单的正则表达式旨在提取标题(\ w [\ w - ] +){2,}在Python(Pandas)与R(stringr)中运行它会产生完全不同的结果!在stringr中,提取工作正常:请参阅...

回答 2 投票 1

在R中导入多个发票(.PDF)。将它们从字符串转换为tibble

所以我正在做一个项目,我需要将大量的.pdfs加载到R中。这部分内容有所涉及。问题是当将pdfs导入R时,每一行都是一个字符串。不是所有......

回答 2 投票 0

第一个字的子串检测

我正在检测报告中的子字符串,然后根据子字符串是否存在而在报告的末尾添加后缀字。较短的单词是危险的,因为它们通常是部分......

回答 2 投票 0

Lookahead正则表达式用于字符串拆分[重复]

我想在每个标题之前分割这个文本(这里只是一个例子)。标题由前面有5个\ n的物种的拉丁名称定义(例如,\ n \ n \ n \ n \ n \ n \ nAcampe carinata(Griff。))。文字......

回答 1 投票 -1

fixed()和coll()对于字符串匹配有什么区别?

几乎所有来自stringr包的帮助文件都包含此行匹配固定字符串(即通过仅比较字节),使用fixed()。这很快,但近似。一般来说,匹配......

回答 1 投票 1

在R中创建一个true / false变量

我有一个变量列,其中包含多个字符串的大字符串值。我想创建一个True / False列,如果在...列中检测到某个值,则报告为true

回答 2 投票 1

是否有R函数将整个df转换为较低的?

我正在设置一个数据表,并希望将所有数据转换为小写,认为它看起来很整洁。我怎样才能做到这一点 ?

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.