从分布图估计p值阈值

问题描述 投票:1回答:1

我的数据采用以下格式,并包含特定统计信息

   site     LRStat
   1        3.580728
   2        2.978038
   3        5.058644
   4        3.699278
   5        4.349046

这只是数据的一个示例。

然后我通过置换随机数据对来获得零LR分布。我用它来绘制直方图,其中y轴为频率,x轴为LR统计量。如何根据零点分布确定关键的p值截止点(如下图所示)?

enter image description here

r histogram distribution p-value
1个回答
3
投票

您现在拥有LR值的采样分布。 R中的quantile函数将为您提供您喜欢的“临界值”的估计值。例如,如果您认为您想要传统的0.05“p值”,则可以使用名为LR_df的数据帧进行说明,并发出以下命令:

quantile( LR_df[ , 'LRStat'] , 0.95) 

如果你想在图上找到所有这些“概率”,你可以使用一个与统一互补的值向量。以下代码为您提供LSstat值,在该值处,给定比例的样本高于该值。

quantile( LR_df[ , 'LRStat'] , c(0.9, 0.95, 0.99, 0.999, 0.9999) ) 

p值只是零假设下检验统计量的抽样分布。在这种情况下,你的零假设是LRstats是均匀分布的。 (我知道这样说听起来很奇怪,但是如果你想与统计学家争论那么就得到http://amstat.tandfonline.com/doi/pdf/10.1198/000313008X332421的副本。)截止值的p值的选择将取决于科学或商业环境。如果你正在评估一个投资机会,截止可能是0.15,但如果你想找到新的科学知识,我认为它应该更小(更严格的测试)。分子遗传学领域在他们的文献中有很多垃圾(即无法重现结果)因为它们在统计学方法上不够严格。

© www.soinside.com 2019 - 2024. All rights reserved.