pgeom 和 ppois 在尝试查找大于或小于 q 的值时返回错误值

问题描述 投票:0回答:1

我是 r 和统计方面的初学者,所以如果这个问题有一个我没有看到的简单答案,我深表歉意。

我正在寻求解决一些需要累积答案< or >而不是q的问题。这是一个例子:

女演员在试镜后获得工作机会的概率为 0.08。她计划继续尝试新工作,直到找到一份工作。假设试用的结果是独立的。 求她需要参加 4 次以上选拔的概率。

我认为这将是 pgeom 的直接使用:

pgeom(q=4,prob=0.08,lower.tail = FALSE) 返回 0.6590815

这不是问题的正确答案。我尝试了 1-pgeom(q=4,prob=0.08),显然仍然给出了相同的答案。我尝试设置 q=5 来看看 r 是否应该包含 4,而它应该被排除。还是错了。 (问题的正确答案是0.7164。)

在 ppois 中遇到同样的问题。谁能解释一下我可能做错了什么?

r distribution
1个回答
0
投票

R 帮助

?pgeom
说:

x,q
分位数向量代表成功发生之前的失败次数。

例如,第 5 次试用成功 = 4 次失败。

请记住,

dgeom()
给出了在第一次成功之前发生一次、准确的失败次数的概率。我们希望所有可能的失败次数的
dgeom()
总和大于或等于 4。

dgeom(4:1000000, .08) |> sum()
#> 0.716393

所以,这是正确的结果。但如何用

pgeom()
实现呢?

1 - pgeom(3, .08)
#> 0.716393

从这个角度来看,这是有道理的:4 包含在我们正在寻找的赞美中,因此我们不应该包含在其他部分中。

与直觉相反,

lower.tail = FALSE
不是表现得像
lower.tail = TRUE
的恭维。

和你一样,我也期待

pgeom(4, .08, lower.tail = F)
#> 0.6590815

给出从 4 开始的累积概率。

但是这是帮助中关于

lower.tail
的内容:

你看:等价关系仅适用于默认的

TRUE

FALSE
时,方向如预期改变,但现在等价关系消失了。我认为非常不直观,但可能有一个我不明白的隐藏原因。

事实证明,

.659
就是我们所得到的

dgeom(5:1000000, .08) |> sum()
#> 0.6590815

确认帮助页面的内容:

pgeom(4, .08, lower.tail = FALSE)
给我们提供了在第一次成功之前发生 5 次或更多失败的概率。

© www.soinside.com 2019 - 2024. All rights reserved.