我希望我可以尽可能的清楚.我有一个excel文件,有400个研究对象,对于他们每个人,我有他们的年龄,他们的性别和40多列生物变量.Es。CODE0001; (年龄)20; M/F; Biovalue1; BioValue2....... Biovalue 40。
我的目标是用1-way Anova分析这些数据,因为我认为这是我最好的选择。我试图做到这一点(即使是使用这个指南)。https:/www.marsja.sefour-ways-to-conduct-one-way-anovas-using-python )但是代码总是有问题。
那么:我如何设置我的数据,才能使用那个网站的代码为例?
我已经为所有的数据做了Dataset.mean()和Dataset.std(),但我不能使用 "平均年龄 "这个值,因为好像Jupyter只把它当作一个字符串而不是一个值来读。
我陷入了深深的困惑之中,所以所有的帮助都将是超级感激的!!!。
先谢谢你
对不起,但我不明白。I'm relatively new to python so maybe i couldn't explain myself properly.I need to do an anova analysis:
首先,我做了这个。
AnalisiISAD.mean()
2)然后我做了一个列表。
MeanList = [......]3)然后我用Anova脚本进行操作
AnalisiI.boxplot('MeanList', by='AgeT0', figsize=(12,8))
ctrl = Analisi['MeanList'][Analisi == 'ctrl']
grps = pd.unique(Analisi.group.values)
d_data = {grp:Analisi['MeanList'][Analisi.group ==grp] for grp in grps}
k = len(pd.unique(Analisi.group))
N = len(Analisi.values)
n = Analisi.groupby('AgeT0').size()[0]
但会出现这个错误。KeyError: 'Column not found: MeanList'
这是否意味着我必须在excel文件中新建一列?我该怎么做呢?
当使用 df.mean()
或 df.std()
试试把数据改成 pd.Series
首先,运行它。