from scipy.stats import chi2_contingency
# defining the table
data = [[1,2,3,4,5,], [10,20,30,40,50]]
stat, p, dof, expected = chi2_contingency(data)
# interpret p-value
alpha = 0.05
print("p value is " + str(p))
if p <= alpha:
print('Dependent (reject H0)')
else:
print('Independent (H0 holds true)')
输出为: p 值为 1.0 独立(H0成立)
尽管您可以清楚地看到两个变量之间存在很强的相关性并且它们相互依赖。 我从 - 获取了代码 https://www.geeksforgeeks.org/python-pearsons-chi-square-test/
皮尔逊卡方检验是对分类数据的统计检验。它用于确定您的数据是否与您的预期显着不同。我建议您阅读:https://www.scribbr.com/statistics/chi-square-tests/#:~:text=A%20Pearson's%20chi%2Dsquare%20test, different%20from%20what%20you%20expected 。 对于数值数据,如果您想检查相关性,可以使用皮尔逊相关系数(如果您找不到好的来源,请也阅读此内容,请告诉我,我将添加链接)
您可以这样做,我保留了大部分代码相同。
from scipy.stats import pearsonr
# defining the table
data = [[1,2,3,4,5,], [10,20,30,40,50]]
corr_coefficient, p_value = pearsonr(data[0], data[1])
# interpret p-value
alpha = 0.05
print("p value is " + str(p))
if p <= alpha:
print('Correlated (reject H0)')
else:
print('Not Correlated (Fail to Reject H0)')
输出: p 值为 1.0 独立(H0成立)
还请记住永远不要说H0是真的,因为我们总是无法拒绝H0。这是因为即使我们的 HA 是错误的,H0 也可能因为其他原因而错误。