将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
我在 r 中有一个数据框,其中有多列名称中具有相似字符,例如: 汤姆_wa = c(1,1,1); tom_ba = c(2,2,2); jim_wa = c(3,3,3); jim_ba = c(4,4,4); df <- ...
填充数据帧中的空白,从第一个非 NA 观察开始到按组最后一个非 NA 观察结束
我的数据框如下所示: df <- structure(list(country = c("Slovenia", "Slovenia", "Slovenia", "Slovenia", "Slovenia", "Slovenia", &
我的问题与上一个问题相切:如何按组汇总并使用 R 中的 dplyr 获取整个数据集的摘要 使用回复中的 reprex 设置新问题:
我有两个数据帧,一个(df1)包含在不同站点观察到的特定事件的最小“流量”值。第二个数据帧(df2)包含完整的流量序列。 df1 <- data...
我正在尝试在两个列表中的大量数据库之间执行完全联接。 平均列表2 平均LD_1.txt 平均LD_2.txt 平均LD_3.txt 。 。 平均LD_70.txt 完整列表2 完整LD_1....
如何创建一个列来计算一系列行的两列之间的差异,这些行的其他两列具有匹配的值
我一直在尝试使用 dplyr、strigr 和 grepl 创建一个新列,用于计算数据集中的列之间的差异,该数据集中具有与两列变量中匹配值的配对列...
我从 R 收到这条消息: 每个 summarise() 组返回多于(或少于)1 行是 在 dplyr 1.1.0 中已弃用。 ℹ 请使用 reframe() 代替。 ℹ 什么时候 从 summarise() 切换到 reframe(),
我正在尝试编写一个 for 循环来检查基于分组变量集的观测值的相对丰度加起来是否达到 100。在下面的简化示例中,我想检查是否所有相关...
抱歉,如果这是非常基本的,我对 R 还很陌生。我有一个数据集,包括天数、类别和值,如下所示。 天 类别 价值 1 A 0.5 3 A 0.1 1 乙 1 4 乙 0.7 1 C 1.2 2 C 1 5 C 0...
为什么我的 dplyr::filter() 命令不起作用,并出现错误,提示 x` 必须是向量,而不是 <ODBC_binary> 对象?
我已经使用 RODBC 包中的 sqlFetch 函数从 SQL Server 数据库中读取了一些数据。数据读取正确(据我所知)。但是,当我尝试应用简单的 dplyr::
我有两个数据框想要使用 dplyr 连接。一个是包含名字的数据框。 测试数据<- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), ...
tidyverse/dplyr 用于 str_detect 案例/mutate 的解决方案
我已经看到了一些这样的片段,但遗憾的是到目前为止还没有完整的答案,所以我想问一下。 我正在开发一个函数,根据某些关键要素的存在或不存在来分配值...
我是 R 的初学者,我尝试根据其他列中的两个条件计算数据框中行之间的差异。 我当前的 df 看起来有点像这样(有更多数据和
我有两个数据集。第一个数据集看起来像 - data.frame(年份 = 2005:2022,CompanyID = 6) 年份 公司 ID 1 2005 年 6 2 2006 年 6 3 2007 年 6 4 2008 年 6 5 2...
我知道这是一个非常愚蠢的问题,但我被困住了。 我有一个数据框(物种),其中包含科学名称列表 结构(列表(科学=结构(c(1L,2L,3L,4L,11L, 13L), 级别 = c("C...
我有一个包含药物处方(同一药物)的数据框,包括处方日期和每日剂量。每个药物处方有一行。每位患者...
假设我在名为 2007d 的数据集中有 8 个名为 MED 1 到 MED8 的 R 变量。我想创建一个名为“Totalmeds”的新变量,如果存在条目,它将是所有 8 个变量的总和...
假设我的数据集有两列 A = c(1,5,NA,NA,NA) B = c(NA,NA,10,11,13) 如何创建一个新列 C,它采用 A 中的最大值和 B 中的最小值来创建新列: C= c(NA,5,10,NA,NA)
我正在处理逐个棒球数据,并希望创建许多滚动平均值,其中一些是基于另一列的条件。数据为 600 万行,因此理想情况下
我正在使用 R 中的数据框,其中列名称为 NA。我需要使用 dplyr 或 tidyr 重命名此列,但标准方法不起作用 数据<- data.frame(a = 1:5) names(data) = NA d...