如何在python中的boostrap中使用Pearson相关性?

问题描述 投票:0回答:1

我有任务需要用 python 完成。描述如下:

使用函数

scipy.stats.bootstrap()
,基于变量
1-alpha = 0.98
:皮尔逊相关系数,在显着性水平
sample_2
下对以下参数进行区间估计。

将结果保存到名为

r_ci
的变量中,其中包含带有置信区间下限和上限的列表。计算各参数值时,将随机数生成器种子对应的
scipy.stats.bootstrap()
中函数参数的值设置为
25

我的代码有问题,我尝试了很多方法。所以基本上我不知道如何在引导程序中使用皮尔逊相关性。我尝试定义一个函数,或者如您所见,我尝试直接在参数中使用它。目前的问题是

x
y
的大小不同。这不是真的,它们都有 25 行,没有 NaN。我尝试了很多建议,但有不同的错误,但原因相同。这段代码应该非常简短,它需要遵循我之前给出的任务,并且没有任何改变
sample_2

x = sp.stats.uniform.rvs(loc=-2, scale=10, size=25, random_state=34)

y = 2*x - 5 + sp.stats.norm.rvs(loc=0, scale=2, size=25, random_state=13)

sample_2 = pd.DataFrame(data=np.array([x, y]).T, columns=["X", "Y"])

boot_strap = sp.stats.bootstrap((sample_2['X'], sample_2['Y']), sp.stats.pearsonr, confidence_level=0.98, random_state=25)

r_ci = [boot_strap.confidence_interval[0], boot_strap.confidence_interval[1]]

print(r_ci)
python statistics correlation statistics-bootstrap pearson-correlation
1个回答
0
投票

好吧,解决方案就是使用一个参数:paired=TRUE

© www.soinside.com 2019 - 2024. All rights reserved.