解释密度图中的 y 轴

问题描述 投票:0回答:1

200人接受了检测,其中20人被感染。我想获得与一个人被感染的概率相关的不确定性的后验分布。

我这样做:

n<-200
s<-20
p<-seq(0,0.3,0.001)

dp<-dbeta(p, s+1, n-s+1)

但是当我绘制它时,我不知道如何解释 y 轴和汇总结果:

plot(p, dp, type="l")

> summary(dp)
     Min.   1st Qu.    Median      Mean   3rd Qu.      Max. 
 0.000000  0.000011  0.032438  3.322259  3.841204 18.820899 

所以有 10% 的机会......是 18.82?或者?这个总结告诉我什么?

另外,第一张图和下面的图有什么区别?

plot(density(dp))

r statistics probability-density density-plot beta-distribution
1个回答
0
投票

所以基本上是在回答情节差异问题,正如所指出的那样,不是很精确。所以让我们再试一次:

第一:图 1 的结果

β 分布限制在 0 和 1 之间。形状受 a(在我们的示例中:21)和 b(在我们的示例中:181)影响。给定该形状,

dbeta(x, shape1, shape2)
用于返回值 x 介于 0 和 1 之间的概率密度。例如,dbeta 对于值 0.1 返回 18.8209(最大值)。现在根据数据,我们应该预计最可能相信的受感染患者数量是样本的 20/200 或 10%。然而,例如,实际百分比有可能为 0.075,但极不可能为 0.3。因此,β 分布将质量置于 x 值 0.1 附近,而在 x 值 0.9 时质量几乎为 0。

第二:y轴的解释

现在最好在这里询问统计数据(我不是)。然而,这里的 y 轴描述的是概率密度。现在,作为启发式思考对 x 轴上的值赋予权重的概率密度。因此,如果您说从均匀分布中绘制,则每个(非零)x 值都同样可能被绘制(因此没有信息)。然而,如果您从正态分布中绘制,则接近平均值的 x 值比远离平均值 5 个标准差的 x 值更有可能绘制。然而,分布曲线下的面积始终为 1。(希望这能给出图片;认为这可能比公式更有帮助)。

第三:结果

因此,如果您想使用

summary
命令评估分布,请执行以下操作:使用
qbeta(0.5, 21, 181)
。这将为您提供 50% 分位数;在这种情况下是 0.1026。因此,我们可以说 50% 的分布位于 0.1026 的右侧(在 x 轴上)。因此,有 50% 的可能性,在 200 名随机选择的人中,感染者的比例大于 10.26(20.52 人)。

最后:

密度命令尝试估计给定数据的密度函数。有点像制作一个带有非常小的中断的直方图并根据条形长度绘制一条曲线(是的我知道)。除此之外,它还将数据的边界平滑到零。然而,你在这里做的是密度上的密度。所以...

希望这有帮助;快速回答,可能包含错误...

© www.soinside.com 2019 - 2024. All rights reserved.