用于字符串操作的R包。
我想要做的是将函数应用于数据框中的多个列,将输出记录为新列。为了更清楚,我想采用以下形式的数据框:first_name ...
我正在清理数据库,其中一个字段是“country”但是我的数据库中的国家/地区名称与我需要的输出不匹配。我虽然使用str_replace函数,但我有超过50个国家......
我一直在搜索网站的评论数据,在这个过程中,我能够获得包含用户名,评论数量,评论日期和国家/地区信息的字符串向量。他们看 ...
我正在尝试提取在文本聊天中标记的用户名,例如“@Jack @Marie Hi there!”我试图在@和空格的组合上做到这一点,但我不能让正则表达式匹配非贪婪(或...
我喜欢根据冒号的存在来拆分pdf文档的信息。这是一个样本。可以从此链接下载包含四个页面的更新PDF我正在尝试以下操作。之后......
给定一个数据框,其中列中的每个观察是一个形式为“x~y”的字符串,其中x和y是整数。目标是将“x~y”字符串转换为向量c(x..y),这是一个...的序列
我试图从以下向量中提取一些变量名称和数字,并将它们存储到两个新变量:unique_strings
我一直在尝试编写一个函数或使用apply family来选择包含我正在寻找的单词的数据框中的行,并将它们标记为标记。一行可以有多个标签。能够 ...
我正在使用R中的stringr包,并希望替换除了单词MATCH之外的所有单词后面的值。我收到的错误是'。 。 。必须有一个有限的最大长度(...
dplyr mutate stringr str_detect,带有多个条件参数和相应的输出
我想以不同的方式改变字符串,具体取决于格式。此示例基于包含某些标点符号的格式有2种。向量的每个元素都包含特定的单词......
我有数百个观察,我想删除包含字符串“english basement”的那些。我似乎无法找到正确的语法。我只能想出如何保持......
如何计算字符串向量中的尾随零。例如,如果我的字符串向量是:x = c('0000','1200','1301','X230','9900')答案应该是> numZeros [1] 4 2 0 1 2我做不......
我想使用stringr包删除所有与字符串模式不匹配的字符。到目前为止,我已经能够使用“\\ w +(?=(grape | satsuma))”作为模式去除模式之前的那些但是......
我试图搜索解决方案,但看起来没有明确的R.我尝试按照模式分割字符串,比方说空格和大写字母,我使用stringr包...
输入是什么:c(“a”,“b”,“c”)[1]“a”“b”“c”我想要一个返回的函数:[1]“a; b”“a; c“”b; c“我需要此功能才能完全关闭其输入。我尝试过一些东西......