根据R [复制]中的各种变量类计算加权平均值

问题描述 投票:0回答:1

这个问题在这里已有答案:

我有不同物种的大小数据。每个样本代表1平方公尺的礁(一个样方;“独特”)。在任何给定年份,每个站点应该有5个样方(“YrSi”)和quadrat中的任何数量的物种(有些物种比其他物种多,而且它们通常不同)。我需要根据每个“YrSi”(年份组合)和“Taxa”(即物种)的“Count”(即加权平均值)的权重来计算“大小”的平均值。例:

head(df)
         Unique   Yr Si   Qd      YrSi                   Taxa Count Size SLength
6  2007-M1-1991 2007 M1 1991 2007 - M1 Carpophyllum flexuosum     7   10        
7  2007-M1-1991 2007 M1 1991 2007 - M1 Carpophyllum flexuosum     1   15        
8  2007-M1-1991 2007 M1 1991 2007 - M1 Carpophyllum flexuosum     5   20        
9  2007-M1-1991 2007 M1 1991 2007 - M1 Carpophyllum flexuosum     4   25        
10 2007-M1-1991 2007 M1 1991 2007 - M1 Carpophyllum flexuosum     4   30        
11 2007-M1-1991 2007 M1 1991 2007 - M1 Carpophyllum flexuosum     1   35  

我尝试使用在ddply中嵌入的weighted.mean。但计算错误,我在所有YrSi的所有物种都得到了相同的值。我怀疑它在所有物种和样本中应用了加权计算。

wt_mean.df = ddply(df, c("YrSi","Taxa"),
 function(x) weighted.mean(df$Size, df$Count))
head(wt_mean.df)
       YrSi                        Taxa       V1
1 2007 - C1           Buccinulum lineum 21.22346
2 2007 - C1       Cantharidus purpureus 21.22346
3 2007 - C1 Carpophyllum maschalocarpum 21.22346
4 2007 - C1           Cominella virgata 21.22346
5 2007 - C1              Cookia sulcata 21.22346
6 2007 - C1            Ecklonia radiata 21.22346
head(wt_mean.df)
       YrSi                        Taxa       V1
1 2007 - C1           Buccinulum lineum 21.22346
2 2007 - C1       Cantharidus purpureus 21.22346
3 2007 - C1 Carpophyllum maschalocarpum 21.22346
4 2007 - C1           Cominella virgata 21.22346
5 2007 - C1              Cookia sulcata 21.22346
6 2007 - C1            Ecklonia radiata 21.22346

计算错误,我得到了所有YrSi中所有物种的相同值。我怀疑它在所有物种和样本中应用了weighted.mean计算。

tail(wt_mean.df)
          YrSi                 Taxa       V1
1603 2019 - T5   Maoricolpus roseus 21.22346
1604 2019 - T5 Patiriella regularis 21.22346
1605 2019 - T5  Sargassum scabridum 21.22346
1606 2019 - T5 Sargassum sinclairii 21.22346
1607 2019 - T5      Trochus viridus 21.22346
1608 2019 - T5   Zonaria turneriana 21.22346

我究竟做错了什么?为什么我在V1中没有得到正确的加权平均值?另外,获得加权的sd会很好,但我还没有调查过。请帮忙。

r weighted-average summarization reorganize
1个回答
0
投票

Dplyr可能是一个简单的解决方案。

library(dplyr)
output <- df%>%
  group_by(Yr, Si, Taxa) %>%
  summarise(wMean = weighted.mean(Size, Count))
© www.soinside.com 2019 - 2024. All rights reserved.