将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
仅返回 R 中所有其他列的列 ID 和年份缺失 (NA) 数据的列表
ID 年 数学子 工程子 化学_sub Comp_sub 1 2010年 20 15 12 不适用 2 2015年 17 号 20 14 16 3 2012年 不适用 17 号 12 不适用 4 2015年 14 13 不适用 不适用 5 2016年 不适用 不适用 不适用 不适用 6 2015年 不适用 不适用 不适用 不适用 你好,我想知道 ab...
挑战如下:我们的任务是使用 dplyr 计算数据框中列子集的按行最小值,但列名称各不相同,并且必须与指定的 va 集合相匹配...
我有一个数据集,其中有事件发生的二进制指示器。从这个列表中,我想创建一个没有事件发生的连续时间步数的计数。举个例子...
我有一个包含多个列的数据集,其中包含来自不同学校的信息。我正在标准化所有信息,因此所有学校都显示相同的信息。为此,我正在努力
我想知道是否有办法将我的数据重新格式化为下面的 Desired_output? 数据<- read.table(header=T, text=" study time nt nc mt mc sdt sdc outcome 1 pre 2...
我想知道是否有办法将我的数据重新格式化为下面的 Desired_output? 数据<- read.table(header=T, text=" study time nt nc mt mc sdt sdc outcome 1 pre 2...
我的数据对每个 ID 有多个观察值。在 ID 级别,我想将所有值转换为最新的非缺失值。我尝试过使用 mutate、group_by(id) 和 which.max(year)
我在使用列表列作为 dplyr::case_when() 的 LHS 输入时遇到问题。 库(“dplyr”) 图书馆(“蒂布尔”) 图书馆(“咕噜”) # 创建一个 tibble 并...
我在 R 中有一个像这样的数据框: df = 数据.frame( 重复 = c(1,1,1,2,2,2), 组 = c("a", "b", "c", "a", "b", "c"), 分辨率 = c(1...
我的数据集包含: 我想要删除的重复 ID(列 ID1 和 ID2) 列列表可以包含重复项之间不同的规范(类型:字符串), 还有 2 个...
即使在相当小的数据集上,我也会遇到堆空间错误。我可以确定我没有耗尽系统内存。例如,考虑一个包含大约 20M 行和 9 列的数据集,并且 t...
问题: 无法解析在scale_y_continous中传递给ggplot2的df变量 目的: 动态执行具有比例的辅助轴。 我的解决方法目前是手动写入总和......
R/dplyr - 根据 2 行删除重复项并指定每列要执行的操作
我的数据集包含: 我想要删除的重复 ID(列 ID1 和 ID2) 列列表可以包含重复项之间不同的规范(类型:字符串), 还有 2 个...
我想在我的数据集中添加“周”列。本周专栏从第 1 周运行到第 5 周。我想将其添加到长数据集 (12) 行。 有没有办法我可以编码来实现这个功能
如何操纵数据来查找独特招聘人员的比例以及他们填补职位的日期[重复]
我正在尝试找出一种简单的方法来按[组]、[地理位置]和[已填补]细分独特招聘人员所填补的职位ID的比例。这最终将达到数万数据的规模......
我正在尝试合并/连接两个数据帧 df 和 df2。 df 是根据在每个位置(第 4 个、第 10 个、第 12 个……字符)切割成字符串的字符向量生成的。初始向量looke...
对数据框进行子集化,以便保留包含 R 中某个变量的所有值的组合
让我们生成我们想要子集的数据帧 v日期 = 序列( 来自 = as.Date("2024-01-01"), to = as.Date("2024-01-5"), 通过 = 1 ) vToy = c(1, 2, 3) vColors = c(&q...
我正在努力寻找一个 R 函数来将我的数据转换为“基线值的倍数变化”。基本上我有一个由 subject.id 和时间点组成的 data.frame,按