将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
给定开始日期和月份(数字),如何根据 R 中的开始日期和月份数创建日期列
例如,我有一个 ID 列表和这些 ID 第一次生成值的开始日期列。我们的 MonthDuration 应该与开始日期相对应。 (例如,对于 ID 1,StartD...
图书馆(dplyr) df <- data.frame(ID = c(1, 1, 1, 1, 2, 2, 3, 3, 3), X1 = c(5, NA, NA, NA, 7, NA, 4, 7, 10), WANT = c(5, 8, 11, 14, 7, 10, 4, 7, 10)) df <- df %>% group_by(ID) %>% 我...
我的数据框有 2 个分类变量,其中一个的层次结构低于另一个。我想使用 dplyr 对子类别中所有行的数值求和。 预先感谢您...
我想创建一个新的变量 sales.T.minus.1 ,它将显示第 - 1 年的销售额。我创建了一个可复制的示例,如下所示: 图书馆(PLM) 图书馆(dplyr) 数据<- pdata....
添加一列,其中包含根据第二个、第三个和第四个最高值计算出的平均值
添加包含最大值的列很简单 df <- df %>% 变异 (v.max = max (x)) 但是,我想添加从 x
我有来自数据记录器的一些温度数据,我想创建一个新列,最好使用 dplyr::mutate() 或其他一些 {tidyverse} 解决方案,在 NA 值的 12 小时内。 其中一个问题是
haven::read_dta 支持使用 label 属性将变量标签从 Stata 导入到 R 中。 Rstudio 还支持在“视图”窗格中显示这些标签。 然而,当两个数据框绑定时
我有一个数据集,其中包含属于不同群体的人员,一个人可以通过名称变体和不同的 person_id 被多次提及。我的计划是比较每个组内的个人价值观...
我有以下数据框: FID1 FID2 PropIBD ABC 防御 0.5000 防御ABC 0.0000 GHI LMO 0.002 改性活生物体 GHI 0 L454 9G09 0 如何从此数据框中删除
我有一个data.frame c,它有两个列a和b。我想将列 a 和平均列 b 分组。 但效果不佳 这是我的数据框和代码 > c 乙 1红60822 2 红色...
如何生成随机数并将其限制在一个范围内? iagegrp 给出年龄范围,age02 给出点值。我可以在每个范围内生成一个随机变量,但我也想限制...
我在 R 中拥有以下数据框(对于熟悉 tidyverse 的人来说,这是 starwars 示例数据集) 我正在尝试创建一个输出两列的 tibble:homeworld 和shortest_5(
在filter()中使用if_any()和starts_with():为什么提供无意义的列名会返回整个数据框?
我一直在 R 中的 dplyr::filter() 函数中使用 dplyr::if_any() 。但是,我发现如果我们传递当前数据框中不存在的列名,什...
我有多个专栏,里面有VC的资金。 df <- data.frame(Company = c("X", "Y","Z"), Valuation = c("10","20","30"), ...
我的数据集有提到变量类别的列,例如: 栏目名称是“Shrawan 2071 - 狗咬”。这里“Shrawan”是月份,“2071”是年份,...
使用皮马印第安人数据集。目标是根据每个特征绘制糖尿病(是或否)的图。然后在条形图中提供总数和百分比。 这是数据的头部: >
在我的数据框中,我有一列是最新可用数据的月份/年份(例如,目前显示的是 12 月 23 日,因为这是最新的,但下个月会显示为 1 月 24 日)。我想计算...
我想知道是否可以在R中的arrow工作流程期间在duckdb上发送SQL查询。(https://duckdb.org/2021/12/03/duck-arrow.html) 我知道它的目的是使用 dplyr 动词,但有一些
我有两个数据框: df1 基于调查回复,并包含一个非限制字段,供用户添加其在英国的位置(或拒绝这样做),格式如下(非真实数据): 姓名 洛...