R:我计算的累积样本分布概率没有达到1.0

问题描述 投票:0回答:0

我想计算我的样本每个因子水平的累积概率并将它们保存到数据框中。 然而,计算的概率没有达到 1.0 并停止,例如在 0.7 这不可能是真的。 不知何故,它总是只对一组达到 1.0。

这是一个可重现的例子:

library(datasets)

ecdf_fun <- ecdf(iris$Sepal.Width)

dset <- iris %>% group_by(Species) %>%
  reframe(ecdval = ecdf_fun(Sepal.Width))

提供:

    Species    ecdval
1   setosa     1.000000000
2   setosa     0.993333333
...
51  versicolor 0.833333333
52  versicolor 0.753333333
...
101 virginica  0.960000000
102 virginica  0.960000000

附加功能: 理想情况下,我想结合它们各自的 x 值(Sepal.Width)来检索累积概率。

    Species    ecdval       Sepal.Width
1   setosa     1.000000000  0.6
2   setosa     0.993333333  ...
...
51  versicolor 0.833333333  1.8
52  versicolor 0.753333333  ...
...
101 virginica  0.960000000  2.5
102 virginica  0.960000000  ...
r distribution sample group ecdf
© www.soinside.com 2019 - 2024. All rights reserved.