将ks.test应用于巨大的数据集

问题描述 投票:0回答:1

我希望进行ks.test以便在两个分布之间进行比较。因此,这就是我进行的方式:

  1. 我从文件vec1中加载了length(vec1) = 720642:这是一个太大的数据集。

  2. 我应用了fitdistr(vec1,"lognormal")->在这里,我得到最适合meanlog=1.69sdlog=1.02的分布的最适合vec1

  3. 当我简单申请时:

    ks.test(vec1, "plnorm", 1.69, 1.02)

    我得到:D = 0.1429p-value < 2.2e-16替代假设:双面

因此测试失败,就像我没有处理对数正态分布....

有人解决方案吗?是因为我从文件中加载了巨大的数据集吗?

r
1个回答
0
投票

对于大数据集,由于大数据集的功率大,您将始终拒绝H0(具有任何指定的参考分布)。

© www.soinside.com 2019 - 2024. All rights reserved.