dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

R:如果不适用,则根据条件并使用列名称模式,将缺失值替换为另一列中的缺失值

我遇到以下问题:对于一项评级,6 个数字列中的 3 个数字列中的值丢失。 我希望将缺失的值替换为所在单元格中的值...

回答 1 投票 0

按组计算数据框中 1 出现的间隔年数

我有以下数据框: 国家 年 冲突 国家1 1990年 1 国家1 1991年 0 国家1 1992年 0 国家1 1993年 0 国家1 1994年 1 国家1 1995年 1 国家1 1996年 0 国家1 1997年 0 数...

回答 3 投票 0

dplyr::mutate 中的向量化函数和逻辑运算符

我正在尝试向量化一个函数以在 dplyr::mutate 中使用。对于我的一生,我无法让它发挥作用。这就是我一直在做的事情: str_to_seq <- Vectorize(function(x) { # This fu...

回答 1 投票 0

计算冲突之间的和平年数

我正在使用 R 包 dplyr。也许有人可以帮助我... 我有以下开始情况: 国家 年 冲突 国家1 1990年 1 国家1 1991年 0 国家1 1992年 0 国家1 1993年 0

回答 1 投票 0

有没有办法在 dbplyr inner_join SQL 翻译中添加 LIKE?

这是此问题的后续问题:How to join dataframes using a prefix as a match? 我在 SQL 服务器端有这两个表: 数据<- memdb_frame( x = c("ANOTHER", "...

回答 1 投票 0

根据条件替换值

我有以下数据框 df <- data.frame(drug = c("__Drug A__", "__NA__", "__Drug B__", "__NA__", "__Drug C__", "__NA__")) and...

回答 2 投票 0

将数据框设为宽格式并对多个变量进行分组

我有一个如下所示的数据框: 例子 <- data.frame( PID = c(11191, 11192, 21191, 21193), NS = c(1,5,9,13), NR = c(2,6,10,14), SE = c(3,7,11,15), GR = c(4,8,12,16) ) I wa...

回答 1 投票 0

如何将具有双精度值和字符值的列取消嵌套到一个字符列中?

我正在尝试构建一个比较 2 个数据框的报告。我正在使用arsenal包中的comparef。问题是为了能够将其导出到 Excel 文件,我需要取消嵌套

回答 1 投票 0

删除重复项,但保留基于特定列的行

我有一个大型数据集,是通过组合多个来源的数据构建的。因此,有许多行是重复的。我知道如何使用 dplyr 和 unique 删除重复项,但我...

回答 2 投票 0

将数据框设为宽格式并通过配对对列进行分组

我有一个可以简化为这样的数据框: 例子 <- data.frame( PID = c(1091, 1358, 1087, 2358, 2087, 2091), value = c('1','2', '1,4,6', '2', '2', '1') ) I want to do a few things...

回答 2 投票 0

在 R 中为大型 DataFrame 中的相关行高效分配通用 ID

我正在使用 R 中的大型数据集,包含大约 1900 万行和超过 81 列,我需要一些指导来有效处理它。 我的数据集跟踪重复出现的记录...

回答 1 投票 0

将 gt 对象转换为数据帧时包含两个标头

我正在使用 gtsummary 包中的函数 tbl_strata 和 tbl_svysummary 执行加权分析。可重现的代码如下 图书馆(dplyr) 库(gtsummary) 图书馆(srvyr) 数据<-

回答 1 投票 0

如何使用前缀作为匹配来连接数据帧?

假设我有这些数据: 数据<- tibble( x = c("ANOTHER", "COMMON", "ZEBRA") ) And I want to join this dataframe with this one: selection <- tibble( x_pre...

回答 2 投票 0

R中如何通过ID提取2个数据帧之间不匹配值的ID?

我正在尝试构建一个包含两个数据帧之间所有不匹配值的报告。我试图在这里应用该解决方案,但由于列数

回答 1 投票 0

扩展包含R中列表的数据框

我有一个数据框,其中包含列表。 df <- data.frame( id=c(1:4), a=I(list(c(1,"a1"),2,c("a31","a32","a33"),"a4")), ...

回答 1 投票 0

在R函数中使用过滤器

我有按年份和季度划分的设备组件成本数据集。由于某些组件的价格按季度变化,而其他组件则按年变化。因为我需要计算

回答 1 投票 0

r 根据条件随机分配 1 或 0

对于这样的数据集 MainID SubID DOB BMI 1234 1234_A 2024 年 2 月 19 日 10.1 1235 1235_A 2023 年 1 月 11 日 17.23 1235 1235_B 2023 年 1 月 11 日 1...

回答 1 投票 0

根据 dplyr 中的给定条件更改多个列值

我正在寻找一种简单的方法来执行类似以下操作,但使用 dplyr,本质上只是在满足条件时用 NA 替换 3 列中的值。 dta[dta$na.ind == 1, c('x1...

回答 3 投票 0

使用非连续时间序列数据计算过去~365天的滚动平均值

我有一个像这样的数据框 日期值 1 2018-09-11 2.049659 2 2018-09-19 2.537952 3 2018-09-24 1.591455 4 2018-10-01 1.012579 5 2018-10-08 1.382486 6 2018-10-15 2.533606 ... 193 2023-1...

回答 1 投票 0

从 R 中的 data.frame 创建一个命名的数字列表

我想从我的数据创建一个命名的数字列表,这样所有以基线结尾的变量都会从相应的以 post1 结尾的变量中减去。 例如,第一个元素'...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.