将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。
R:如果不适用,则根据条件并使用列名称模式,将缺失值替换为另一列中的缺失值
我遇到以下问题:对于一项评级,6 个数字列中的 3 个数字列中的值丢失。 我希望将缺失的值替换为所在单元格中的值...
我有以下数据框: 国家 年 冲突 国家1 1990年 1 国家1 1991年 0 国家1 1992年 0 国家1 1993年 0 国家1 1994年 1 国家1 1995年 1 国家1 1996年 0 国家1 1997年 0 数...
我正在尝试向量化一个函数以在 dplyr::mutate 中使用。对于我的一生,我无法让它发挥作用。这就是我一直在做的事情: str_to_seq <- Vectorize(function(x) { # This fu...
我正在使用 R 包 dplyr。也许有人可以帮助我... 我有以下开始情况: 国家 年 冲突 国家1 1990年 1 国家1 1991年 0 国家1 1992年 0 国家1 1993年 0
有没有办法在 dbplyr inner_join SQL 翻译中添加 LIKE?
这是此问题的后续问题:How to join dataframes using a prefix as a match? 我在 SQL 服务器端有这两个表: 数据<- memdb_frame( x = c("ANOTHER", "...
我有以下数据框 df <- data.frame(drug = c("__Drug A__", "__NA__", "__Drug B__", "__NA__", "__Drug C__", "__NA__")) and...
我有一个如下所示的数据框: 例子 <- data.frame( PID = c(11191, 11192, 21191, 21193), NS = c(1,5,9,13), NR = c(2,6,10,14), SE = c(3,7,11,15), GR = c(4,8,12,16) ) I wa...
我正在尝试构建一个比较 2 个数据框的报告。我正在使用arsenal包中的comparef。问题是为了能够将其导出到 Excel 文件,我需要取消嵌套
我有一个大型数据集,是通过组合多个来源的数据构建的。因此,有许多行是重复的。我知道如何使用 dplyr 和 unique 删除重复项,但我...
我有一个可以简化为这样的数据框: 例子 <- data.frame( PID = c(1091, 1358, 1087, 2358, 2087, 2091), value = c('1','2', '1,4,6', '2', '2', '1') ) I want to do a few things...
在 R 中为大型 DataFrame 中的相关行高效分配通用 ID
我正在使用 R 中的大型数据集,包含大约 1900 万行和超过 81 列,我需要一些指导来有效处理它。 我的数据集跟踪重复出现的记录...
我正在使用 gtsummary 包中的函数 tbl_strata 和 tbl_svysummary 执行加权分析。可重现的代码如下 图书馆(dplyr) 库(gtsummary) 图书馆(srvyr) 数据<-
假设我有这些数据: 数据<- tibble( x = c("ANOTHER", "COMMON", "ZEBRA") ) And I want to join this dataframe with this one: selection <- tibble( x_pre...
我有一个数据框,其中包含列表。 df <- data.frame( id=c(1:4), a=I(list(c(1,"a1"),2,c("a31","a32","a33"),"a4")), ...
对于这样的数据集 MainID SubID DOB BMI 1234 1234_A 2024 年 2 月 19 日 10.1 1235 1235_A 2023 年 1 月 11 日 17.23 1235 1235_B 2023 年 1 月 11 日 1...
我正在寻找一种简单的方法来执行类似以下操作,但使用 dplyr,本质上只是在满足条件时用 NA 替换 3 列中的值。 dta[dta$na.ind == 1, c('x1...
我有一个像这样的数据框 日期值 1 2018-09-11 2.049659 2 2018-09-19 2.537952 3 2018-09-24 1.591455 4 2018-10-01 1.012579 5 2018-10-08 1.382486 6 2018-10-15 2.533606 ... 193 2023-1...
我想从我的数据创建一个命名的数字列表,这样所有以基线结尾的变量都会从相应的以 post1 结尾的变量中减去。 例如,第一个元素'...