dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

如何从数据帧的列/唯一行值迭代创建矩阵/向量,并将它们传递给后续代码?

我想跨数据帧中的列迭代一段代码,以创建一个新的结果矩阵。我陷入了如何使用/以值命名来迭代创建新对象和矩阵的困境......

回答 1 投票 0

如何更改行的顺序?

请告知如何控制弹性表中的行顺序。 例如,在流行病学家 R 手册中的表格中,行的顺序按升序排列,而其他行和缺失行...

回答 2 投票 0

Flextable 或 dplyr R - 更改行顺序

请告知如何控制弹性表中的行顺序。 例如,在表《The Epidemiological R Handbook》中,行的顺序按升序排列,而“Other”和“Missing”行则位于中间...

回答 1 投票 0

按开始时间和结束时间之间的最长间隔重新排列行

在此类数据中: df # 小题:9 × 6 id 话语 故事高潮 Starttime_ms Endtime_ms 在此类数据中: df # A tibble: 9 × 6 id Utterance Story Climax Starttime_ms Endtime_ms <dbl> <chr> <chr> <chr> <dbl> <dbl> 1 4 "yeah" NA NA 20405 23532 2 5 "Come Home " "Come Home " NA 20405 47677 #<-- 3 6 ">last time " NA NA 23818 25110 4 7 "two weeks ago? " NA NA 25470 26259 5 8 "and X" NA NA 26623 32103 6 9 "and then last night" NA NA 32688 33797 7 10 "are you sure?" NA NA 34099 37542 8 11 "Come Home climax " NA "Come Home climax " 34099 39895 #<--- 9 12 "=she said Y" NA NA 38075 39895 我需要重新排列行,使这些行 其中 Starttime_ms 和 Endtime_ms 之间的间隔大于前一行 AND 其中 Startttime_ms 与上一行中的相同 放在上一行之前。这怎么办? 所需的输出是这样的: df # A tibble: 9 × 6 id Utterance Story Climax Starttime_ms Endtime_ms <dbl> <chr> <chr> <chr> <dbl> <dbl> 2 5 "Come Home " "Come Home " NA 20405 47677 1 4 "yeah" NA NA 20405 23532 3 6 ">last time " NA NA 23818 25110 4 7 "two weeks ago? " NA NA 25470 26259 5 8 "and X" NA NA 26623 32103 6 9 "and then last night" NA NA 32688 33797 8 11 "Come Home climax " NA "Come Home climax " 34099 39895 7 10 "are you sure?" NA NA 34099 37542 9 12 "=she said Y" NA NA 38075 39895 这不是一种方便的复制格式(请参阅 ?dput 或 reprex 包),但类似于 library(dplyr) df_sort <- (df |> mutate(dt = endtime - starttime) |> arrange(starttime, dt) ) 应该有效(arrange的第一个参数是主要排序键;后面的参数用作主要类别中的决胜局/排序)。如果您不想保留时差变量,可以添加 select(-dt)。

回答 1 投票 0

For 循环 - 从现有数据帧的列/唯一行值迭代创建矩阵/向量,并传递到后续代码

我是在 R 中编写函数和循环的新手,并且想要跨数据帧中的列迭代一大块代码,以创建新的结果矩阵。我陷入了如何迭代的困境......

回答 1 投票 0

根据条件进行变异

我正在尝试使用 mutate + ifelse 在数据集中创建一个新变量。 我的示例数据集如下 df = 结构(列表(id = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10), resp_gender = c("女"...

回答 1 投票 0

在R中,如何在每个堆叠的条上放置误差条,特别是在使用facet_grid时?

这是一个数据集 df=数据.frame( 品种=代表(c(“CV1”,“CV2”),每个= 8L), 部分=代表(代表(c(“DW1”,“DW2”),2),每个= 4L), 光 = 代表(代表(c(“...

回答 1 投票 0

filter() 函数在 for 循环中不起作用

我写了下面的代码 miRNA.列表 <- c("let-7a-5p", "let-7a-1-3p", "let-7b-5p") summary.df <- data.frame() for (miRNA in miRNA.list) { temp.name <- miRNA...

回答 2 投票 0

在多个嵌套数据帧上匹配元数据

我正在从 API 中提取指标数据,该 API 会返回包含不同大小的嵌套数据帧的数据帧,以保存其他元数据。我正在尝试将其矩形化,但运气不佳。

回答 1 投票 0

编写自定义延迟评估函数(如 dbplyr)来获取 SQL

我该如何编写这个函数的逻辑,它应该能够做两件事。 获取数据<- function(database, table=NULL, query=NULL){ rlang::check_required( x = database ) if(i...

回答 1 投票 0

按组选择前 n 个值,其中 n 取决于数据框中的其他值

我对 R 和编码总体来说还很陌生。我们将非常感谢您的帮助:) 我正在尝试按组选择前 n 个值,其中 n 取决于其他值(在下面称为因子)...

回答 2 投票 0

我想用这样的方式总结R中的一个巨大的数据框,我只需要唯一的“lat”,“lon”,“Date(Year)”和“Maxium Value”

我需要总结一个巨大的CSV文件(nrow = 1102300)。这是来自各种气候模型的每日气候数据。 首先,我想总结所有具有“历史”名称的列。我的目标是...

回答 1 投票 0

箭头中的distinct(.keep_all = TRUE)的替代品?

我有一个比内存更大的箭头数据集,由 open_dataset() 从分区镶木地板文件创建,我需要在其上使用distinct(.keep_all = TRUE)。我需要将计算保存在磁盘上,因此...

回答 1 投票 0

按字符类型对行进行排序

我需要对列字符类型的行进行排序,首先显示从最高到最低排序的数字,然后显示带有“<" in a specific order: first "”的字符 我需要对列字符类型的行进行排序,首先显示从最高到最低排序的数字,然后显示带有“<" in a specific order: first " 来自: 致: data.table::data.table(Resultado = c("1,39", "5,89", "3,12", "0,25", "<LCM", "<LDM", "<LDM", "<LCM")) 将变量转换为.character()。 接下来,定义自定义订单。 然后重新排序。 dt <- data.table(Resultado = c("1,39", "5,89", "3,12", "0,25", "<LCM", "<LDM", "<LDM", "<LCM")) dt[, Resultado := as.character(Resultado)] custom_order <- c(rev(sort(dt[!Resultado %like% "<"][order(-as.numeric(gsub(",", ".", Resultado)))]$Resultado)), "<LCM", "<LDM") dt <- dt[order(match(Resultado, custom_order))] > print(dt) Resultado 1: 5,89 2: 3,12 3: 1,39 4: 0,25 5: <LCM 6: <LCM 7: <LDM 8: <LDM

回答 1 投票 0

使用 case_match() 和 char 数组重新编码值

在 dplyr 包中,recode() 已被 case_match() 取代。有没有办法使用存储在 char 数组中的标签来使用 case_match() 重新编码值? 例如,与 r...

回答 1 投票 0

R:使用 case_match() 和 char 数组重新编码值

在 dplyr 包中,recode() 已被 case_match() 取代。有没有办法使用存储在 char 数组中的标签来使用 case_match() 重新编码值? 例如,与 r...

回答 1 投票 0

自动更改列表的列表

如何改变 10 列,如果基因在模块内则包含 TRUE,如果不在模块内则包含 FALSE? gene_express = data.frame(gene = c('基因1', '基因2', '基因3', '基因4', '基因5', '基因...

回答 1 投票 0

更高效的汇总/R 中的汇总

我有执行大量汇总的代码,需要很长时间才能运行。 例如: 图书馆(dplyr) df <- data.frame(Letter = letters, Num = c(1 : (26*10) )) for (x in 1:10000){ df_sum_Tot =

回答 1 投票 0

如何获得R中唯一的组合组?

我正在对一些数据进行分组,例如实体数据。我根据一些实体属性找到了组,如下所示: df <- data.frame(uniq_index.x = c(1426, 1426, 1426, 1426, 7796, 7796, 7796,

回答 1 投票 0

如何汇总数据并将新行绑定到现有数据框?

编辑以回应评论。 我正在阅读加州 58 个县几年来的公共气温数据。我想创建一个摘要,即全州每日平均值,然后输入

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.