用于字符串操作的R包。
如何使用字符串匹配特定中文单词之前的数字?例如2020年1月4日(2020年1月4日)?我想得到这样的东西:[1] 2020 1 4
我想代表对话的小标题,然后将其转换为.txt,可以在文本编辑器中对其进行手动编辑,然后返回小标题进行处理。我遇到的主要挑战是...
使用unite和str_to_title:NA被组合为字符串,而未被检测为NA R
我在两列中合并了NA。合并之前,我使用str_to_title来创建值的一致性。问题在于,现在NA尚未注册为NA,并且它们已合并为...
最近,我问了一个问题,以创建一个复杂的正则表达式来拆分字符串(在此)。我正在使用R基座,因此一切正常。但是,我现在想在...
我有许多本质上是我想重新编码为整数的因素的变量。许多变量是一个字符串,第一个字符是一个数字,对应于...
我已经从pdf在线获取数据,并且停留在需要从矩阵获取2行的位置。以下是矩阵的结构。我必须获取'IE07''146250'和'...
我已将一个收件箱提取到csv,并且每封电子邮件的主体都以以下格式输出:“发件人:名称[email protected] mailto:[email protected] text text text”长...
计算一个字符串序列的平均值,然后除去大于R中平均值的2SD的任何东西
我有一个超过10,000行的大型数据集:df:用户持续时间amy 582 amy 27 amy 592 amy 16 amy ...
我正在尝试使用正则表达式分割字符串。我的正则表达式代码应该与冒号前面的两个单词匹配,最终目的是分割这样的内容:“乔·拜登:我们需要...
为什么列上的stringr :: str_match返回小标题?
我正在使用tidyverse加载数据,所以我有一个小标题,您可以像这样复制它:df_1
我想基于现有变量(PI_NAME)的格式创建一个新变量(cPI)。 PI_NAMEs包含一个名称和多个名称的组合。如果存在多个名称,则...
我有一个总统辩论的文本文件。最终,我想将文本解析为一个数据帧,其中每一行都是一个语句,其中一列带有说话者的姓名,另一列带有...
我尝试从数据集中的一列字符串中提取一个子字符串,然后尝试将其分解。但是,它仍然向我显示相同类别的重复,例如应该只有一个...