dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

删除数据框中包含常用字符名称的列

我在 r 中有一个数据框,其中有多列名称中具有相似字符,例如: 汤姆_wa = c(1,1,1); tom_ba = c(2,2,2); jim_wa = c(3,3,3); jim_ba = c(4,4,4); df <- ...

回答 3 投票 0

填充数据帧中的空白,从第一个非 NA 观察开始到按组最后一个非 NA 观察结束

我的数据框如下所示: df <- structure(list(country = c("Slovenia", "Slovenia", "Slovenia", "Slovenia", "Slovenia", "Slovenia", &

回答 1 投票 0

如何使用 dplyr 按组汇总和总计缺失计数?

我的问题与上一个问题相切:如何按组汇总并使用 R 中的 dplyr 获取整个数据集的摘要 使用回复中的 reprex 设置新问题:

回答 1 投票 0

计算单独分组数据帧中值的百分位数

我有两个数据帧,一个(df1)包含在不同站点观察到的特定事件的最小“流量”值。第二个数据帧(df2)包含完整的流量序列。 df1 <- data...

回答 1 投票 0

如何使用正则表达式在循环中进行完全连接

我正在尝试在两个列表中的大量数据库之间执行完全联接。 平均列表2 平均LD_1.txt 平均LD_2.txt 平均LD_3.txt 。 。 平均LD_70.txt 完整列表2 完整LD_1....

回答 1 投票 0

如何创建一个列来计算一系列行的两列之间的差异,这些行的其他两列具有匹配的值

我一直在尝试使用 dplyr、strigr 和 grepl 创建一个新列,用于计算数据集中的列之间的差异,该数据集中具有与两列变量中匹配值的配对列...

回答 1 投票 0

summarize() 在 R 中已弃用。用什么代替?

我从 R 收到这条消息: 每个 summarise() 组返回多于(或少于)1 行是 在 dplyr 1.1.0 中已弃用。 ℹ 请使用 reframe() 代替。 ℹ 什么时候 从 summarise() 切换到 reframe(),

回答 1 投票 0

for 循环中的过滤或子集化

我正在尝试编写一个 for 循环来检查基于分组变量集的观测值的相对丰度加起来是否达到 100。在下面的简化示例中,我想检查是否所有相关...

回答 1 投票 0

如何通过从 R 中的现有列中减去值来生成新数据集?

抱歉,如果这是非常基本的,我对 R 还很陌生。我有一个数据集,包括天数、类别和值,如下所示。 天 类别 价值 1 A 0.5 3 A 0.1 1 乙 1 4 乙 0.7 1 C 1.2 2 C 1 5 C 0...

回答 1 投票 0

为什么我的 dplyr::filter() 命令不起作用,并出现错误,提示 x` 必须是向量,而不是 <ODBC_binary> 对象?

我已经使用 RODBC 包中的 sqlFetch 函数从 SQL Server 数据库中读取了一些数据。数据读取正确(据我所知)。但是,当我尝试应用简单的 dplyr::

回答 1 投票 0

加入dplyr时如何指定x和y的列名?

我有两个数据框想要使用 dplyr 连接。一个是包含名字的数据框。 测试数据<- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), ...

回答 3 投票 0

tidyverse/dplyr 用于 str_detect 案例/mutate 的解决方案

我已经看到了一些这样的片段,但遗憾的是到目前为止还没有完整的答案,所以我想问一下。 我正在开发一个函数,根据某些关键要素的存在或不存在来分配值...

回答 1 投票 0

如何根据其他列中的两个条件计算数据框中行之间的差异?

我是 R 的初学者,我尝试根据其他列中的两个条件计算数据框中行之间的差异。 我当前的 df 看起来有点像这样(有更多数据和

回答 1 投票 0

使用另一个数据集中的观察结果过滤一个数据集

我有两个数据集。第一个数据集看起来像 - data.frame(年份 = 2005:2022,CompanyID = 6) 年份 公司 ID 1 2005 年 6 2 2006 年 6 3 2007 年 6 4 2008 年 6 5 2...

回答 1 投票 0

基于列表创建新列

我知道这是一个非常愚蠢的问题,但我被困住了。 我有一个数据框(物种),其中包含科学名称列表 结构(列表(科学=结构(c(1L,2L,3L,4L,11L, 13L), 级别 = c("C...

回答 1 投票 0

如何根据组的另一列更正 data.frame 中的日期

我有一个包含药物处方(同一药物)的数据框,包括处方日期和每日剂量。每个药物处方有一行。每位患者...

回答 1 投票 0

如何仅将某些变量的条目值更改为 NA

假设我在名为 2007d 的数据集中有 8 个名为 MED 1 到 MED8 的 R 变量。我想创建一个名为“Totalmeds”的新变量,如果存在条目,它将是所有 8 个变量的总和...

回答 1 投票 0

变异以按组从其他列中创建具有最大值和最小值的新列

假设我的数据集有两列 A = c(1,5,NA,NA,NA) B = c(NA,NA,10,11,13) 如何创建一个新列 C,它采用 A 中的最大值和 B 中的最小值来创建新列: C= c(NA,5,10,NA,NA)

回答 1 投票 0

如何使用 dplyr 创建条件且高效的滚动平均值

我正在处理逐个棒球数据,并希望创建许多滚动平均值,其中一些是基于另一列的条件。数据为 600 万行,因此理想情况下

回答 1 投票 0

使用 dplyr 或 tidyr 重命名 NA 命名列

我正在使用 R 中的数据框,其中列名称为 NA。我需要使用 dplyr 或 tidyr 重命名此列,但标准方法不起作用 数据<- data.frame(a = 1:5) names(data) = NA d...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.