dplyr 相关问题

将此标记用于与dplyr包中的函数相关的问题,例如group_by,summarize,filter和select。

跨数据集匹配元素并将一个数据集中的单元格替换为另一个数据集的单元格

我有以下简化的数据集,并想用 rs123456 替换 1:70728:C:T。 一个<- data.frame(ID=c(3,44),SNP=c("1:70728:C:T","1:612758:T:C "),effect_allele.out...

回答 1 投票 0

R:跨数据集匹配元素并将一个数据集中的单元格替换为另一个数据集的单元格

我有以下简化的数据集,并想用 rs123456 替换 1:70728:C:T。 一个<- data.frame(ID=c(3,44),SNP=c("1:70728:C:T","1:612758:T:C "),effect_allele.out...

回答 1 投票 0

在多列中查找特定项目的多个字符串并返回 R 中的列名

我想在多个列中查找特定项目的两个字符串。我需要获取 Item_Name 中每个项目包含“0/1”或“1/1”的列名。 示例数据框: 伊特...

回答 1 投票 0

比较两个数据帧并将其中一个数据帧的差异替换为另一个数据帧的值

假设我有两个数据框: df1 <- data.frame( Name = c("Alice", "Bob", "Charlie"), Age = c(25, 30, 22), City = c("New York", "San Fra...

回答 1 投票 0

检查生存时间序列的逻辑

我有一个数据框,其中包含许多独特个体在很长一段时间内的生存数据(1 = 活着,0 = 死亡):每个个体(即每行)都有一系列 0 和 1(每列代表.. .

回答 1 投票 0

使用pivot_wider根据类别D将值从类别A、B、C中划分出来

在下面的示例数据框中,我想从类别“A”、“...”的条目中的收入(同一产品)中减去类别“D”中条目的“收入”

回答 2 投票 0

如何过滤包含超过 3 个观测值的行?

我有一个简单的数据集,我正在尝试查找具有超过 3 个观测值 (n) 的城市。但是,我在使用 fct_lump() 函数时遇到错误。你能帮我找出问题所在吗?

回答 1 投票 0

根据第三列中的值计数以及值的名称总结第二列[重复]

我想根据第三列中的值计数以及值的名称来总结第二列。 df: 姓名 年龄 年份 75 2000 B 60 1990 C 75 2000 D 60 1990 E 75 2030 ...

回答 1 投票 0

dplyr:根据第三列中的值计数以及值的名称总结第二列[重复]

我想根据第三列中的值计数以及值的名称来总结第二列。 df: 姓名 年龄 年份 75 2000 B 60 1990 C 75 2000 D 60 1990 E 75 2030 ...

回答 1 投票 0

标记 R 中先前出现的 X 次

我有一个包含许多不同社交媒体创建者(creator_id)的数据集。他们发布了很多次(posting_count),如果 ad = 1,则帖子被分类为广告。现在我总是想对 3 pre 进行分类...

回答 3 投票 0

使用 dplyr 按组获取高于标准的行的平均值

我正在尝试获取高于特定阈值(按组)的行的平均值。不幸的是,我的尝试没有产生有效的结果。 数据: df <- data.frame( id=c(1:10), group=c("a&qu...

回答 1 投票 0

如何将数据框拆分为多个数据框,但将相似的行分组到相同的行中?

我有一个超过 20k 行的数据框。如下是我的数据框的示例: df <- data.frame( ID = c("1234", "edje", "hgt1", "4567", "0900&q...

回答 1 投票 0

如何连接R中的两个表,用第二个表中的数据更新第一个表中的NA?

我有两张表格,其中的信息是相互补充的。 数据集_a <- data.frame(id = 1:10, country = c(rep("England", 5), rep("Northern Ireland", 5)), population = c(

回答 1 投票 0

如何删除重复的列并仅保留最长的列?

我有一个包含多个列的数据框,并且某些列显示彼此重叠的值。 我将给出此数据框的两个重叠列的示例: V1976 V2066 206603 211261 216048

回答 1 投票 0

如何使用 grepl() 在数据帧列表中选择特定字符串?

在数据帧列表中,我需要选择名为“id”的变量和包含“Duo”的变量。因此,我将在输出中为每个 datafrmae 有两个变量。 数据<- li...

回答 1 投票 0

在R markdown中,按组打印数据帧值?

我正在努力帮助一些朋友创建一份在我们州发现的植物物种的格式化“清单”。 数据如下所示(除了有超过 3,000 个分类单元): 数据<- as.data.frame(cb...

回答 1 投票 0

如何在忽略 NA 的情况下检查重复项(NA 值被视为匹配)

我想知道如何最好地检查重复项,但以忽略 NA 值的方式 - 即,如果将某个值与 NA 进行比较,则将其视为匹配。 例如,如果我有这样的数据集 dt &...

回答 1 投票 0

停止变异截断列列名

我正在使用带有大量 ifelse 条件的 mutate 制作一个大型数据框。我的方法是不命名 mutate 中的列,因为我有数百个这样的条件,每次更新......

回答 1 投票 0

使用lag和dplyr进行计算,按行按组迭代

我有一些数据,如以下数据框: df = data.frame(name=c(rep("Group1",5),rep("Group2",5)), 周一=c(1,2,3,4,5,1,2,3,4,5), amt=c(10,NA,...

回答 1 投票 0

将年龄个体的计数转换为中位数和 IQR

我有一个数据框,其中包含特定年份访问应用程序的客户数量的年龄数据。第一列是以年份 c(0, 1, 2...) 为单位的年龄值,接下来的列是各个年份。 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.