我如何将组均值与单个观察值进行比较,并创建一个新的TRUE / FALSE列?

问题描述 投票:0回答:1

我是R的新手,这是我关于SO的第一篇文章-所以请多包涵。

我正在尝试识别数据集中的异常值。我有两个data.frames:

((1-原始数据集,192行):观测值及其值(AvgConc)

((2-使用dplyr创建,共24行):原始数据集中的组平均值,以及分位数,最小值和最大值

我想在原始数据集中创建一个新列,该列根据(AvgConc)大于还是小于我在第二个data.frame中计算出的最小值给出TRUE / FALSE。我该怎么做?

尝试失败:

Outliers <- Original.Data %>%
 group_by(Status, Stim, Treatment) %>%
 mutate(Outlier = Original.Data$AvgConc > Quantiles.Data$Maximum | Original.Data$AvgConc <  Quantiles.Data$Minimum) %>%
 as.data.frame()

错误:列Outlier的长度必须为8(组大小)或一个而不是192)>

我是R的新手,这是我关于SO的第一篇文章-所以请多多包涵。我正在尝试识别数据集中的异常值。我有两个data.frames:(1-原始数据集,192行):观察值和...

r dataframe dplyr purrr outliers
1个回答
0
投票

[在这里,我们需要通过与'Original.Data'Quantiles.Data$'Status','Stim','Treatment'的联接来删除by

© www.soinside.com 2019 - 2024. All rights reserved.