我想计算我的样本每个因子水平的累积概率并将它们保存到数据框中。 然而,计算的概率没有达到 1.0 并停止,例如在 0.7 这不可能是真的。 不知何故,它总是只对一组达到 1.0。
这是一个可重现的例子:
library(datasets)
ecdf_fun <- ecdf(iris$Sepal.Width)
dset <- iris %>% group_by(Species) %>%
reframe(ecdval = ecdf_fun(Sepal.Width))
提供:
Species ecdval
1 setosa 1.000000000
2 setosa 0.993333333
...
51 versicolor 0.833333333
52 versicolor 0.753333333
...
101 virginica 0.960000000
102 virginica 0.960000000
附加功能: 理想情况下,我想结合它们各自的 x 值(Sepal.Width)来检索累积概率。
Species ecdval Sepal.Width
1 setosa 1.000000000 0.6
2 setosa 0.993333333 ...
...
51 versicolor 0.833333333 1.8
52 versicolor 0.753333333 ...
...
101 virginica 0.960000000 2.5
102 virginica 0.960000000 ...