dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

给定开始日期和月份(数字),如何根据 R 中的开始日期和月份数创建日期列

例如,我有一个 ID 列表和这些 ID 第一次生成值的开始日期列。我们的 MonthDuration 应该与开始日期相对应。 (例如,对于 ID 1,StartD...

回答 1 投票 0

R DPLYR 填写值

图书馆(dplyr) df <- data.frame(ID = c(1, 1, 1, 1, 2, 2, 3, 3, 3), X1 = c(5, NA, NA, NA, 7, NA, 4, 7, 10), WANT = c(5, 8, 11, 14, 7, 10, 4, 7, 10)) df <- df %>% group_by(ID) %>% 我...

回答 1 投票 0

如何在 R 中使用 dplyr 基于组和子组对行求和?

我的数据框有 2 个分类变量,其中一个的层次结构低于另一个。我想使用 dplyr 对子类别中所有行的数值求和。 预先感谢您...

回答 2 投票 0

创建 T-1 变量 | R

我想创建一个新的变量 sales.T.minus.1 ,它将显示第 - 1 年的销售额。我创建了一个可复制的示例,如下所示: 图书馆(PLM) 图书馆(dplyr) 数据<- pdata....

回答 2 投票 0

添加一列,其中包含根据第二个、第三个和第四个最高值计算出的平均值

添加包含最大值的列很简单 df <- df %>% 变异 (v.max = max (x)) 但是,我想添加从 x

回答 1 投票 0

根据不同列中的一系列值来改变列中的值

我有来自数据记录器的一些温度数据,我想创建一个新列,最好使用 dplyr::mutate() 或其他一些 {tidyverse} 解决方案,在 NA 值的 12 小时内。 其中一个问题是

回答 1 投票 0

dplyr bind_rows 不保留变量标签

haven::read_dta 支持使用 label 属性将变量标签从 Stata 导入到 R 中。 Rstudio 还支持在“视图”窗格中显示这些标签。 然而,当两个数据框绑定时

回答 5 投票 0

如果我使用 mutate 运行函数会得到不同的结果

我有一个数据集,其中包含属于不同群体的人员,一个人可以通过名称变体和不同的 person_id 被多次提及。我的计划是比较每个组内的个人价值观...

回答 1 投票 0

如何在R中识别倒排并删除它们?

我有以下数据框: FID1 FID2 PropIBD ABC 防御 0.5000 防御ABC 0.0000 GHI LMO 0.002 改性活生物体 GHI 0 L454 9G09 0 如何从此数据框中删除

回答 1 投票 0

为什么group_by不能正确计算平均值?

我有一个data.frame c,它有两个列a和b。我想将列 a 和平均列 b 分组。 但效果不佳 这是我的数据框和代码 > c 乙 1红60822 2 红色...

回答 1 投票 0

通过创建新列来转换数据框

我有一个包含长格式 t 检验结果的数据框,想对其进行转换,以便将 p 值信息创建为新列。 我的数据框是 结构(列表(区域= c(“

回答 1 投票 0

如何生成有限制的随机数?

如何生成随机数并将其限制在一个范围内? iagegrp 给出年龄范围,age02 给出点值。我可以在每个范围内生成一个随机变量,但我也想限制...

回答 1 投票 0

如何删除R中的重复行?

我在 R 中拥有以下数据框(对于熟悉 tidyverse 的人来说,这是 starwars 示例数据集) 我正在尝试创建一个输出两列的 tibble:homeworld 和shortest_5(

回答 2 投票 0

在filter()中使用if_any()和starts_with():为什么提供无意义的列名会返回整个数据框?

我一直在 R 中的 dplyr::filter() 函数中使用 dplyr::if_any() 。但是,我发现如果我们传递当前数据框中不存在的列名,什...

回答 1 投票 0

基于多列计算频率

我有多个专栏,里面有VC的资金。 df <- data.frame(Company = c("X", "Y","Z"), Valuation = c("10","20","30"), ...

回答 1 投票 0

根据 tidyverse 中的列名称创建新列

我的数据集有提到变量类别的列,例如: 栏目名称是“Shrawan 2071 - 狗咬”。这里“Shrawan”是月份,“2071”是年份,...

回答 1 投票 0

为geom_col()添加百分比标签

使用皮马印第安人数据集。目标是根据每个特征绘制糖尿病(是或否)的图。然后在条形图中提供总数和百分比。 这是数据的头部: >

回答 1 投票 0

如何通过 R 中的数字而不是名称来计算列的平均值

在我的数据框中,我有一列是最新可用数据的月份/年份(例如,目前显示的是 12 月 23 日,因为这是最新的,但下个月会显示为 1 月 24 日)。我想计算...

回答 1 投票 0

R 中 arrow duckdb 工作流程的 SQL 查询

我想知道是否可以在R中的arrow工作流程期间在duckdb上发送SQL查询。(https://duckdb.org/2021/12/03/duck-arrow.html) 我知道它的目的是使用 dplyr 动词,但有一些

回答 2 投票 0

两个数据帧之间文本字符串的不对称部分匹配

我有两个数据框: df1 基于调查回复,并包含一个非限制字段,供用户添加其在英国的位置(或拒绝这样做),格式如下(非真实数据): 姓名 洛...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.