我是 r 和统计方面的初学者,所以如果这个问题有一个我没有看到的简单答案,我深表歉意。
我正在寻求解决一些需要累积答案< or >而不是q的问题。这是一个例子:
女演员在试镜后获得工作机会的概率为 0.08。她计划继续尝试新工作,直到找到一份工作。假设试用的结果是独立的。 求她需要参加 4 次以上选拔的概率。
我认为这将是 pgeom 的直接使用:
pgeom(q=4,prob=0.08,lower.tail = FALSE) 返回 0.6590815
这不是问题的正确答案。我尝试了 1-pgeom(q=4,prob=0.08),显然仍然给出了相同的答案。我尝试设置 q=5 来看看 r 是否应该包含 4,而它应该被排除。还是错了。 (问题的正确答案是0.7164。)
在 ppois 中遇到同样的问题。谁能解释一下我可能做错了什么?
R 帮助
?pgeom
说:
x,q
分位数向量代表成功发生之前的失败次数。
例如,第 5 次试用成功 = 4 次失败。
请记住,
dgeom()
给出了在第一次成功之前发生一次、准确的失败次数的概率。我们希望所有可能的失败次数的 dgeom()
总和大于或等于 4。
dgeom(4:1000000, .08) |> sum()
#> 0.716393
所以,这是正确的结果。但如何用
pgeom()
实现呢?
1 - pgeom(3, .08)
#> 0.716393
从这个角度来看,这是有道理的:4 包含在我们正在寻找的赞美中,因此我们不应该包含在其他部分中。
与直觉相反,
lower.tail = FALSE
不是表现得像lower.tail = TRUE
的恭维。
和你一样,我也期待
pgeom(4, .08, lower.tail = F)
#> 0.6590815
给出从 4 开始的累积概率。
但是这是帮助中关于
lower.tail
的内容:
你看:等价关系仅适用于默认的
TRUE
。FALSE
时,方向如预期改变,但现在等价关系消失了。我认为非常不直观,但可能有一个我不明白的隐藏原因。
事实证明,
.659
就是我们所得到的
dgeom(5:1000000, .08) |> sum()
#> 0.6590815
确认帮助页面的内容:
pgeom(4, .08, lower.tail = FALSE)
给我们提供了在第一次成功之前发生 5 次或更多失败的概率。