dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

如何创建一个由多个单独的列条目组成的列表的数据框列?

我想在下面的示例数据集中创建第五列,其中每行包含一个列 2:4 的列表。第一行所需的输出为 c(20,40,14),...

回答 1 投票 0

R 使用管道运算符时的条件评估 %>%

在 dplyr、ggvis、dycharts 等软件包中使用管道运算符 %>% 时,如何有条件地执行步骤?例如; 步骤_1 %>% 步骤_2%>% 如果(条件) 步骤_3 这些适合...

回答 7 投票 0

跨列应用多个汇总函数:summarise_all:无法强制“list”对象输入“double”

我正在尝试创建一个描述性统计表,为数据帧的每一列获取以下统计数据:平均值、标准差、第 10 个、第 50 个和第 90 个分位数。然后我想转置数据...

回答 3 投票 0

dplyr summarise_all:无法强制“list”对象输入“double”

我正在尝试创建一个描述性统计表,为数据帧的每一列获取以下统计数据:平均值、标准差、第 10 个、第 50 个和第 90 个分位数。然后我想转置数据...

回答 2 投票 0

根据 Y/N 标志和连续跟踪列确定和标记唯一跨度[关闭]

根据初始指南编辑问题已关闭: 我有一个很大的数据集,在 12 年的时间里大约有 50 万个成员,我需要根据 elig_flag 和 Continuous_elig_counter 来确定

回答 3 投票 0

R 中按行变化的变量计算

我有这样的数据: 图书馆(dplyr) 设置.种子(123) 数据<- data.frame( date = rep(1:3, each=3), grupo = rep(c("A", "B", "C"), 3), x = runif(9, 10, 50), y =...

回答 1 投票 0

按图案分开行,调整图案出现的次数

我有一个数据框,如下所示: # 加载必要的库 图书馆(dplyr) # 创建数据框 测试<- data.frame( address = c("123 Elm St", "456 Oak St", "789 Pine...

回答 1 投票 0

dplyr::across 中的函数参数用于在多列上进行转换

我想使用 dplyr::across 将一些 [0,1] 变量重新编码为级别为 ["no","yes"] 的因子。我成功了,但我想了解如何定义函数参数...

回答 1 投票 0

arrange_at 与 .funs 的令人困惑的行为

我不明白 dplyr::arrange_at 在传递 .funs 参数时正在做什么。 例如假设我们创建一个数据框 Z: 图书馆(dplyr) <- expand.grid(A = c(1:2, NA), B = c(1:2, NA)) ...

回答 1 投票 0

如何使用distinct(..., .keep_all = TRUE) 但指定要保留哪一行?

假设我有以下内容: > df 坐标 1 A 1 o 2A 0米 3A 1克 我想保留独特的观察结果,而不考虑特定的列,例如: > dplyr::distinct(df, dplyr::across(-...

回答 2 投票 0

R Lubridate:将日期时间舍入/对齐到一天中最接近的任意时间?

我有一个日期时间列表,如下所示: 数据<- data.frame(datetimes = c(ymd_hms("2024-01-01 04:12:35"), ymd_hms("2024-04-01 14:52:20"...

回答 1 投票 0

使用 mutate 将更多变量粘贴在一起,而不对列名称 R 进行硬编码

我已经检查过以前的类似帖子,但没有找到我需要的解决方案。 我需要使用变异和粘贴将更多变量粘贴到新列中,但我需要避免硬编码......

回答 2 投票 0

Tidyverse/Dplyr 解决方案,用于为从嵌套列表中提取的列名称分配值

我有一个 tibble,其中有一列包含嵌套列表(>>具体的数据类型)。 它看起来类似于以下内容(但采用 R/Arrow 格式): ID 内斯特瓦...

回答 1 投票 0

使用子集与 dplyr::filter 的不一致

我有一个数据框,根据使用的过滤方法给出不同的结果。请参见下面的屏幕截图,这看起来很奇怪。对于为什么会这样有什么想法吗?

回答 1 投票 0

dplyr 按组汇总大于阈值的总和值

我有一个大约 64,000 行的数据框,其结构如下 df <- data.frame(FY = c(2018, 2018, 2019, 2019, 2020, 2020), WorkArea = c("03218", "03219", "07589", "

回答 1 投票 0

在 dplyr 的汇总函数中进行过滤

我在 dplyr 上有点挣扎,因为我想同时做两件事,想知道这是否可能。 我想计算值的平均值,同时计算具有...

回答 3 投票 0

按日期范围过滤多列,并计算最大值

数据框 df <- structure (list( subject_id = c("232-5467", "232-6784", "232-3457", "232-0987", "232-1245", "232-1945"),

回答 1 投票 0

按日期范围过滤多列,并计算R中的最大值

数据框 df <- structure (list( subject_id = c("232-5467", "232-6784", "232-3457", "232-0987", "232-1245", "232-1945"),

回答 1 投票 0

dplyr:如何使用distinct(..., .keep_all = TRUE) 但指定要保留哪一行?

假设我有以下内容: > df 坐标 1 A 1 o 2A 0米 3A 1克 我想保留独特的观察结果,而不考虑特定的列,例如: > dplyr::distinct(df, dplyr::across(-...

回答 1 投票 0

基于 ICD-10 标准的抑郁症严重程度 R 代码

我正在尝试根据 ICD-10 标准和 MDI(重度抑郁量表)的数据提出抑郁症严重程度的 R 代码。该调查问卷由 12 个问题组成(mdi_1、mdi_2、

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.