我有多个数据帧存储在数据帧列表中,我需要从每个数据帧中取出某个列,例如 ['d'] 并将其放入新定义的数据帧中,但将它们放在彼此旁边,以便计算最后每行的平均值。如何在 python 中做到这一点。
数据帧列表 = [df1,df2,df3,df4,..dfn]
所有 dfs 具有相同的列数和名称,例如 a、b、c、d、e、f、g,但行数不同(长度不同)df1 有 115 行,df2 有 220 行,df3 有 90 行,等等。
newDataFrame=pd.DataFrame() 被定义为将每个 dataFrame 中所需的列 d 放在此处。 d1,d2,d3,d4,....dn 但它们必须彼此正确,才能计算每行的平均值。
如何做到这一点?
newDataFrame=(d1 d2 d3 d4 ... dn)
2 5 7 8 .... 1
3 4 8 9 .... 2
。
。
.
南 9 南 15 ...9
data_dict1 = {'A': list("AAA"),'B': list("BBB"),'C': list("CCC")}
data_dict2 = {'A': list("QWE"),'B': list("ASD"),'C': list("ZXC")}
data_dict3 = {'A': list("1234"),'B': list("5678"),'C': list("X09Z")}
df1 = pd.DataFrame(data_dict1)
df2 = pd.DataFrame(data_dict2)
df3 = pd.DataFrame(data_dict3)
df4 = df3.copy()
df4['A'] = df1['A']
df4['B'] = df2['B']
df4['C'] = df3['C']
df4