Anova分析Python_紧急

问题描述 投票:0回答:1

我希望我可以尽可能的清楚.我有一个excel文件,有400个研究对象,对于他们每个人,我有他们的年龄,他们的性别和40多列生物变量.Es。CODE0001; (年龄)20; M/F; Biovalue1; BioValue2....... Biovalue 40。

我的目标是用1-way Anova分析这些数据,因为我认为这是我最好的选择。我试图做到这一点(即使是使用这个指南)。https:/www.marsja.sefour-ways-to-conduct-one-way-anovas-using-python )但是代码总是有问题。

那么:我如何设置我的数据,才能使用那个网站的代码为例?

我已经为所有的数据做了Dataset.mean()和Dataset.std(),但我不能使用 "平均年龄 "这个值,因为好像Jupyter只把它当作一个字符串而不是一个值来读。

我陷入了深深的困惑之中,所以所有的帮助都将是超级感激的!!!。

先谢谢你

python database data-analysis anova
1个回答
0
投票

对不起,但我不明白。I'm relatively new to python so maybe i couldn't explain myself properly.I need to do an anova analysis:

首先,我做了这个。

AnalisiISAD.mean()

2)然后我做了一个列表。

MeanList = [......]3)然后我用Anova脚本进行操作

AnalisiI.boxplot('MeanList', by='AgeT0', figsize=(12,8))

ctrl = Analisi['MeanList'][Analisi == 'ctrl']

grps = pd.unique(Analisi.group.values)

d_data = {grp:Analisi['MeanList'][Analisi.group ==grp] for grp in grps}

k = len(pd.unique(Analisi.group))

N = len(Analisi.values)

n = Analisi.groupby('AgeT0').size()[0]

但会出现这个错误。KeyError: 'Column not found: MeanList'

这是否意味着我必须在excel文件中新建一列?我该怎么做呢?


0
投票

当使用 df.mean()df.std()试试把数据改成 pd.Series 首先,运行它。

© www.soinside.com 2019 - 2024. All rights reserved.