对熊猫的汇总统计数据的均值检验有何差异?

问题描述 投票:0回答:1

我希望对两个DataFrame的摘要统计量进行均值检验方面的差异。

df1[['sd']].describe()
                sd
count  5000.000000
mean      0.635558
std       0.086109
min       0.492922
25%       0.577885
50%       0.639906
75%       0.688645
max       0.800767

df2[['sd']].describe()
                sd
count  5000.000000
mean      0.640954
std       0.084459
min       0.496823
25%       0.577373
50%       0.644122
75%       0.693863
max       0.798076

我正在寻找一些可以调用这些汇总统计信息的功能,以告诉我我的均值差异是否具有统计学意义。

python pandas numpy statistical-test
1个回答
0
投票

您可以对独立样本执行t检验:

from scipy.stats import ttest_ind

ttest_ind(df1['sd'], df2['sd'])

输出将是t统计量,p值。

© www.soinside.com 2019 - 2024. All rights reserved.