我希望进行ks.test以便在两个分布之间进行比较。因此,这就是我进行的方式:
我从文件vec1
中加载了length(vec1) = 720642
:这是一个太大的数据集。
我应用了fitdistr(vec1,"lognormal")
->在这里,我得到最适合meanlog=1.69
和sdlog=1.02
的分布的最适合vec1
当我简单申请时:
ks.test(vec1, "plnorm", 1.69, 1.02)
我得到:D = 0.1429
,p-value < 2.2e-16
替代假设:双面
因此测试失败,就像我没有处理对数正态分布....
有人解决方案吗?是因为我从文件中加载了巨大的数据集吗?
对于大数据集,由于大数据集的功率大,您将始终拒绝H0(具有任何指定的参考分布)。