pgeom 和 ppois 在尝试查找大于或小于 q 的值时返回错误值

Question

我是 r 和统计方面的初学者，所以如果这个问题有一个我没有看到的简单答案，我深表歉意。

我正在寻求解决一些需要累积答案< or >而不是q的问题。这是一个例子：

女演员在试镜后获得工作机会的概率为 0.08。她计划继续尝试新工作，直到找到一份工作。假设试用的结果是独立的。求她需要参加 4 次以上选拔的概率。

我认为这将是 pgeom 的直接使用：

pgeom(q=4,prob=0.08,lower.tail = FALSE) 返回 0.6590815

这不是问题的正确答案。我尝试了 1-pgeom(q=4,prob=0.08)，显然仍然给出了相同的答案。我尝试设置 q=5 来看看 r 是否应该包含 4，而它应该被排除。还是错了。（问题的正确答案是0.7164。）

在 ppois 中遇到同样的问题。谁能解释一下我可能做错了什么？

Answer 1

R 帮助

?pgeom

说：

x,q
分位数向量代表成功发生之前的失败次数。

例如，第 5 次试用成功 = 4 次失败。

请记住，

dgeom()

给出了在第一次成功之前发生一次、准确的失败次数的概率。我们希望所有可能的失败次数的

dgeom()

总和大于或等于 4。

dgeom(4:1000000, .08) |> sum()
#> 0.716393

所以，这是正确的结果。但如何用

pgeom()

实现呢？

1 - pgeom(3, .08)
#> 0.716393

从这个角度来看，这是有道理的：4 包含在我们正在寻找的赞美中，因此我们不应该包含在其他部分中。

与直觉相反，

lower.tail = FALSE

不是表现得像

lower.tail = TRUE

的恭维。

和你一样，我也期待

pgeom(4, .08, lower.tail = F)
#> 0.6590815

给出从 4 开始的累积概率。

但是这是帮助中关于

lower.tail

的内容：

你看：等价关系仅适用于默认的

TRUE

。
当

FALSE

时，方向如预期改变，但现在等价关系消失了。我认为非常不直观，但可能有一个我不明白的隐藏原因。

事实证明，

.659

就是我们所得到的

dgeom(5:1000000, .08) |> sum()
#> 0.6590815

确认帮助页面的内容：

pgeom(4, .08, lower.tail = FALSE)

给我们提供了在第一次成功之前发生 5 次或更多失败的概率。