dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

R:使用带有列前缀的字符向量来创建新列,对带前缀的列进行求和值

我有一个具有以下粗略结构的大型数据集,其中多个列共享前缀: 数据集<- data.frame(a1 = c(1:10), a2 = c(11:20),b1=c(21:30),b2=c(31:40)) I want to create new

回答 1 投票 0

应用分组和权重时,如何使用数据框中所有列的摘要工具计算频率和描述性统计数据?

在 R 中,我有一个数据框(mydf),如下所示: 重量 性别 变量1 变量2 100 中号 1 3 800 F 2 8 10 F 2 9 150 F 4 10 (但有 100 列(var3、var 4 等)和 2000 行)。 我想计算

回答 1 投票 0

随机选择的非 NA 列的行平均值

我有一个数据框,对于每一行,我想随机采样三列(其中三列在行之间可以不同)并取这三个采样值的平均值。作为补充

回答 2 投票 0

使用 R 在多列中多次满足条件后从数据帧中删除行

我问了一个关于任一行中满足的条件的类似问题(根据每列中的单独条件删除两列中的行):我现在正在寻找这个问题的轻微变化...

回答 1 投票 0

从数据框中提取(或隔离)“分组常量”列,*使用 dplyr/tidyverse*

如何使用 dplyr/tidyverse 从数据框中提取(或isolate_分组常量列? 这是道尔/哈德利几十年前的问题的更新。早期海报的例子...... 你...

回答 3 投票 0

在每个级别进行总结,并将其附加到下一个级别 R 的 tidyverse 中的摘要中

我想要的输出是将 DATA2 添加到 DATA3,同时保留 DATA3 的行数。 是否可以将这两者通过管道相互连接,以便我们首先在 EL 级别计算 n(),然后在 EL 下进一步计算

回答 1 投票 0

R - 计算具有公共前缀的列之间的比例

我有一个包含 37 列的数据框,其中有一个代表性样本,df 下面 df <- structure(list(irm = 201201:201212, trans11 = c(379L, 433L, 468L, 514L, 559L, 566L, 577L, 622L, 665L, 692L...

回答 1 投票 0

使用动态方法计算用于时间序列分析的日期变量

在下面的示例中,我想根据每个客户和产品的 Date 计算变量 Date_replaced 和 Date_current_until 。 Date_replaced 反映了产品被替换的时间点...

回答 1 投票 0

在R data.table中查找时间上两个不同标签之间的时间间隔,标签-数据

我有一个具有(简化)结构的表格日志文件:,并且想要找到两个不同的event_tags之间的间隔,问题和一切都很好。困难在于...

回答 1 投票 0

如何在 dplyr 中自动生成表达式对/LHS 和 RHS

假设我有一个公式和一些值。我正在尝试执行以下 mutate 语句,其格式为 result{value}=my_formula({value},col1,col2,col3): 图书馆(dplyr) 我的公式<-

回答 2 投票 0

使用 dplyr 或 data.table 使用一个数据帧中的日期来过滤单独的数据帧

我有一个数据框,其中包含随着时间的推移从不同用户(df)收集的所有值(数据)。我有一个单独的数据框(df1),指示不同事件的开始/结束日期。我愿意...

回答 1 投票 0

利用 dplyr::case_match() 周围的自定义包装函数中的值标签进入 dplyr::mutate() 和 dplyr::across() 内部

我是一名社会科学家,经常处理调查数据。许多变量是四点同意-不同意李克特量表,回答选项为“强烈同意”、“有点同意”...

回答 1 投票 0

将因子水平从冒号更改为行

我使用 tbl_summary fron gtsummary 制作了调查问题的汇总表,其中答案有 5 或 7 个级别同意、不同意等,但表格很长。有什么方法可以吗...

回答 1 投票 0

如何根据部分变量名称合并多个数据帧列表中的多列?

我有一长串数据帧,其中每个数据帧中都有一些列需要根据名称合并。也就是说,包括 Duo: 在内的列中的值应替换 v...

回答 1 投票 0

根据一列值是否大于另一列创建新列

我正在尝试创建一列,显示一列(fishing_effort_start_date_time)的值(即时间)何时大于(即稍后的时间)另一列(

回答 1 投票 0

使用 case_when 和 dplyr::filter() 来压缩几个嵌套的 ifelse 语句

我正在编写一个函数,该函数接受 4 个输入,并使用 dplyr 根据输入值格式化数据帧。请注意,每个输入可以有 2 个值:“None”或“X”。我...

回答 1 投票 0

按两个因素对观察结果进行分组后计算单独的百分比

我使用“group_by”和两个因素对数据集进行了分组,并计算了每个结果组属于每个感兴趣类别的观察数量,如下所示。 df1 <- d...

回答 1 投票 0

删除数据框中包含常用字符名称的列

我在 r 中有一个数据框,其中有多列名称中具有相似字符,例如: 汤姆_wa = c(1,1,1); tom_ba = c(2,2,2); jim_wa = c(3,3,3); jim_ba = c(4,4,4); df <- ...

回答 3 投票 0

填充数据帧中的空白,从第一个非 NA 观察开始到按组最后一个非 NA 观察结束

我的数据框如下所示: df <- structure(list(country = c("Slovenia", "Slovenia", "Slovenia", "Slovenia", "Slovenia", "Slovenia", &

回答 1 投票 0

如何使用 dplyr 按组汇总和总计缺失计数?

我的问题与上一个问题相切:如何按组汇总并使用 R 中的 dplyr 获取整个数据集的摘要 使用回复中的 reprex 设置新问题:

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.