dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

Tidyverse/Dplyr 解决方案,用于为从嵌套列表中提取的列名称分配值

我有一个 tibble,其中有一列包含嵌套列表(>>具体的数据类型)。 它看起来类似于以下内容(但采用 R/Arrow 格式): ID 内斯特瓦...

回答 1 投票 0

使用子集与 dplyr::filter 的不一致

我有一个数据框,根据使用的过滤方法给出不同的结果。请参见下面的屏幕截图,这看起来很奇怪。对于为什么会这样有什么想法吗?

回答 1 投票 0

dplyr 按组汇总大于阈值的总和值

我有一个大约 64,000 行的数据框,其结构如下 df <- data.frame(FY = c(2018, 2018, 2019, 2019, 2020, 2020), WorkArea = c("03218", "03219", "07589", "

回答 1 投票 0

在 dplyr 的汇总函数中进行过滤

我在 dplyr 上有点挣扎,因为我想同时做两件事,想知道这是否可能。 我想计算值的平均值,同时计算具有...

回答 3 投票 0

按日期范围过滤多列,并计算最大值

数据框 df <- structure (list( subject_id = c("232-5467", "232-6784", "232-3457", "232-0987", "232-1245", "232-1945"),

回答 1 投票 0

按日期范围过滤多列,并计算R中的最大值

数据框 df <- structure (list( subject_id = c("232-5467", "232-6784", "232-3457", "232-0987", "232-1245", "232-1945"),

回答 1 投票 0

dplyr:如何使用distinct(..., .keep_all = TRUE) 但指定要保留哪一行?

假设我有以下内容: > df 坐标 1 A 1 o 2A 0米 3A 1克 我想保留独特的观察结果,而不考虑特定的列,例如: > dplyr::distinct(df, dplyr::across(-...

回答 1 投票 0

基于 ICD-10 标准的抑郁症严重程度 R 代码

我正在尝试根据 ICD-10 标准和 MDI(重度抑郁量表)的数据提出抑郁症严重程度的 R 代码。该调查问卷由 12 个问题组成(mdi_1、mdi_2、

回答 1 投票 0

如何用两个不同的表格和匹配信息创建新表格

我想用两个不同的数据表创建一个新表,就像这样。 表 1) 名称到代码:成对比较的匹配数据 #表格1 名称代码 甲乙 空调 广告 埃 乙...

回答 1 投票 0

重塑 XYZ 数据框,使其有一列包含名称,三列包含 R 中的每个坐标

我有这个数据集,名为地标。 它有 3 个头骨(每行)和一组 3 个带 XYZ 的地标(BRG、LMB、OPI) 里程碑 <- structure(list(SNPRC = c("1X3930", "1X4286",...

回答 1 投票 0

使用 group_by 自定义函数时出错并在 r 中的 dplyr 中汇总

我尝试使用 dplyr::group_by 编写自定义函数并进行总结。 但总是出错,“row.names”长度。 我简化了数据和代码,找到了原因。这是数据和代码: 瑟...

回答 1 投票 0

根据数据框中的特定值提取列名称

我有以下数据: 我的数据<- tribble( ~item1, ~item2, "car", "ferrari", "house", "3 bed", NA, "3" ) I am trying to extract the...

回答 2 投票 0

如何识别开始到结束日期范围与“目标”日期范围相交的情况

想象这个数据集。 图书馆(tidyverse) 库(润滑) df <- data.frame( ID = 1:10, start_date_smoking = c("28/06/2011", "27/07/2012", "09/04/2003", "...

回答 1 投票 0

使用 R 进行序列覆盖

我有一个包含 100 个氨基酸 (AA) 的蛋白质序列,可以作为数据框进行处理。每个 AA 都有一个位置,目前最重要的是位置: 蛋白质 <- data.frame(AA = 1:100) Tha...

回答 2 投票 0

在 R 数据框中计算访客持续时间:如何计算代理时间、房间时间和等待时间?

我有一个 R 数据框,其中包含来自机构的数据。访客 (ID) 进入代理机构 (CREATE),然后被叫到不同的房间 (CALL),并离开这些房间 (DISCHARGE)。现在,我想计算...

回答 2 投票 0

没有适用于“character”类对象的“inner_join”方法?

我正在尝试合并两个不同的列:Type.1 和 Type.2。两者具有相同的类型(字符),但是当我尝试 inner_join() 时,我收到以下消息: 图书馆(dplyr) 类型_联合 <- inne...

回答 1 投票 0

计算每列的平均值并排除行

我的数据包含 1000 列和 80 行,每五行对应一个组(第一列是类列)我想计算所有数字列的每个组的平均值,然后我...

回答 1 投票 0

对数据框中变量的每个值重复绘制 ggplot

我想为数据框中变量的每个值制作一个图表,然后将该值作为标题传递给图表。我认为最好的方法是使用

回答 3 投票 0

如何使用sql、python或r整合缓慢变化的维度表?

我有以下输入表: ID 类型 价值 日期_从 日期到 1 部门 金融 2020-01-01 9999-12-31 1 人数 10 2020-01-01 2020-02-03 1 人数 15 2020-02-04 9999-12-31 1 地点 直流 202...

回答 1 投票 0

如何在基于 `dplyr::arrange` 的 R 函数中使用一个参数对数据框进行升序或降序排序

下面的函数可以使用一个参数对多列数据框进行排序,并使用不带引号的列作为参数。 库(rlang) 图书馆(dplyr) #> #> 附加包:'dplyr' #>

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.