dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

如何计算R数据集中每个女性的孩子数量?

我正在使用 R 中的数据集,并尝试根据每个女性与户主的关系来计算每个女性的孩子数量。数据集包含诸如

回答 1 投票 0

转换日期字符串或 Excel 整数

我需要从用户填写的 Excel 表单中转换日期字符串,该表单可以采用多种格式,包括将日期作为 Excel 整数(我知道这本来可以被阻止,但事实并非如此)。我想要...

回答 1 投票 0

如何过滤开始日期和结束日期位于 R 中两个日期之间的情况

想象这个数据集。 图书馆(tidyverse) 库(润滑) df <- data.frame( ID = 1:10, start_date_smoking = c("28/06/2011", "27/07/2012", "09/04/2003", "...

回答 1 投票 0

dplyr 改变 case_when grepl 在 R 中无法正确返回值

在给定的数据集中,我在位置 7 处有 cash 、 other 以及 cash.other 。 df <- data.frame(values = c("loan", "cash", "equity", "other", "commer...

回答 1 投票 0

如何使用传统的二元运算符进行 na.rm

我有一个数据集,其中缺失值由 NA 或 9 表示。(是的,我应该将 9 重新编码为 NA,但我没有制作数据集。)我想计算NA 和 nu...

回答 1 投票 0

(R, dplyr) 选择以相同字符串开头的多列,并按组汇总平均值 (90% CI)

我是 tidyverse 的新手,从概念上讲,我想计算以“ab”开头、按“case”分组的所有列的平均值和 90% CI。尝试了很多方法但似乎都不起作用,我的实际数据有很多列...

回答 2 投票 0

R 删除另一行中包含的多余重复项

我有一个想要减少的“索引”数据集。我想减少与另一行相比相同但具有 NA 的行。但是,如果有信息,我不想删除行......

回答 1 投票 0

R 初学者问题:Dataframe 与加载到 R 中的数据集相同吗?

我正在尝试将变量子集到一个易于使用的文件中进行分析,而不必查看数千个变量。然而,我认为我的数据框是“read_dta”,我......

回答 1 投票 0

将时间间隔转换为等小时并填写值栏

我有这种结构的数据(YR天气预报) df1 <- read.table(text = "time temperature 00 0 01 0 02 1 03 1 04 2 05 2 06 2 07-13 3 13-19 4 19-01 1", header = TRUE) I want to...

回答 1 投票 0

使用值序列对行进行子集化并标识序列开始的列

我有一个这种格式的大型数据集。我想 a) 识别具有以下值序列 1 - 1 - >1 - >1 x1 和 x10 之间任意位置的 ID/行;和 b) 生成一个新的变量...

回答 1 投票 0

如何从数据帧的列/唯一行值迭代创建矩阵/向量,并将它们传递给后续代码?

我想跨数据帧中的列迭代一段代码,以创建一个新的结果矩阵。我陷入了如何使用/以值命名来迭代创建新对象和矩阵的困境......

回答 1 投票 0

如何更改行的顺序?

请告知如何控制弹性表中的行顺序。 例如,在流行病学家 R 手册中的表格中,行的顺序按升序排列,而其他行和缺失行...

回答 2 投票 0

Flextable 或 dplyr R - 更改行顺序

请告知如何控制弹性表中的行顺序。 例如,在表《The Epidemiological R Handbook》中,行的顺序按升序排列,而“Other”和“Missing”行则位于中间...

回答 1 投票 0

按开始时间和结束时间之间的最长间隔重新排列行

在此类数据中: df # 小题:9 × 6 id 话语 故事高潮 Starttime_ms Endtime_ms 在此类数据中: df # A tibble: 9 × 6 id Utterance Story Climax Starttime_ms Endtime_ms <dbl> <chr> <chr> <chr> <dbl> <dbl> 1 4 "yeah" NA NA 20405 23532 2 5 "Come Home " "Come Home " NA 20405 47677 #<-- 3 6 ">last time " NA NA 23818 25110 4 7 "two weeks ago? " NA NA 25470 26259 5 8 "and X" NA NA 26623 32103 6 9 "and then last night" NA NA 32688 33797 7 10 "are you sure?" NA NA 34099 37542 8 11 "Come Home climax " NA "Come Home climax " 34099 39895 #<--- 9 12 "=she said Y" NA NA 38075 39895 我需要重新排列行,使这些行 其中 Starttime_ms 和 Endtime_ms 之间的间隔大于前一行 AND 其中 Startttime_ms 与上一行中的相同 放在上一行之前。这怎么办? 所需的输出是这样的: df # A tibble: 9 × 6 id Utterance Story Climax Starttime_ms Endtime_ms <dbl> <chr> <chr> <chr> <dbl> <dbl> 2 5 "Come Home " "Come Home " NA 20405 47677 1 4 "yeah" NA NA 20405 23532 3 6 ">last time " NA NA 23818 25110 4 7 "two weeks ago? " NA NA 25470 26259 5 8 "and X" NA NA 26623 32103 6 9 "and then last night" NA NA 32688 33797 8 11 "Come Home climax " NA "Come Home climax " 34099 39895 7 10 "are you sure?" NA NA 34099 37542 9 12 "=she said Y" NA NA 38075 39895 这不是一种方便的复制格式(请参阅 ?dput 或 reprex 包),但类似于 library(dplyr) df_sort <- (df |> mutate(dt = endtime - starttime) |> arrange(starttime, dt) ) 应该有效(arrange的第一个参数是主要排序键;后面的参数用作主要类别中的决胜局/排序)。如果您不想保留时差变量,可以添加 select(-dt)。

回答 1 投票 0

For 循环 - 从现有数据帧的列/唯一行值迭代创建矩阵/向量,并传递到后续代码

我是在 R 中编写函数和循环的新手,并且想要跨数据帧中的列迭代一大块代码,以创建新的结果矩阵。我陷入了如何迭代的困境......

回答 1 投票 0

根据条件进行变异

我正在尝试使用 mutate + ifelse 在数据集中创建一个新变量。 我的示例数据集如下 df = 结构(列表(id = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10), resp_gender = c("女"...

回答 1 投票 0

在R中,如何在每个堆叠的条上放置误差条,特别是在使用facet_grid时?

这是一个数据集 df=数据.frame( 品种=代表(c(“CV1”,“CV2”),每个= 8L), 部分=代表(代表(c(“DW1”,“DW2”),2),每个= 4L), 光 = 代表(代表(c(“...

回答 1 投票 0

filter() 函数在 for 循环中不起作用

我写了下面的代码 miRNA.列表 <- c("let-7a-5p", "let-7a-1-3p", "let-7b-5p") summary.df <- data.frame() for (miRNA in miRNA.list) { temp.name <- miRNA...

回答 2 投票 0

在多个嵌套数据帧上匹配元数据

我正在从 API 中提取指标数据,该 API 会返回包含不同大小的嵌套数据帧的数据帧,以保存其他元数据。我正在尝试将其矩形化,但运气不佳。

回答 1 投票 0

编写自定义延迟评估函数(如 dbplyr)来获取 SQL

我该如何编写这个函数的逻辑,它应该能够做两件事。 获取数据<- function(database, table=NULL, query=NULL){ rlang::check_required( x = database ) if(i...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.