我想比较R中两个技术重复项的平均值,标准差和CV百分比。
当前我的数据框看起来像这样:
Sample Phagocytic_Score
1 1232 24030
2 1232 11040
3 4321 7266
4 4321 4096
5 5631 7383
6 5631 21507
因此,我想将第1行和第2行,第3行和第4行等等的值进行比较。理想情况下,将其与平均得分和统计信息一起存储在新的数据框中,如果有意义的话。
对不起,我对R还是陌生的,如果真的很简单,请向我致歉。
谢谢!马里
summarize()
可以为您提供准确的信息,特别是如果您要的所有统计信息都是在一个变量(即Sample
:]定义的组内计算的话)
library(raster) #> Loading required package: sp library(tidyverse) data <- tribble( ~rowname, ~Sample, ~Phagocytic_Score, 1, 1232, 24030, 2, 1232, 11040, 3, 4321, 7266, 4, 4321, 4096, 5, 5631, 7383, 6, 5631, 21507 ) data %>% group_by(Sample) %>% summarize( mean = mean(Phagocytic_Score), sd = sd(Phagocytic_Score), pct_cv = cv(Phagocytic_Score) ) #> # A tibble: 3 x 4 #> Sample mean sd pct_cv #> <dbl> <dbl> <dbl> <dbl> #> 1 1232 17535 9185. 52.4 #> 2 4321 5681 2242. 39.5 #> 3 5631 14445 9987. 69.1
由reprex package(v0.3.0)创建于2019-10-22
[如果我了解您的问题,您希望通过根据其中一列进行分组来总结数据框。我认为在您的真实数据中,您对每个样本并不总是有两个准确的观察结果。