我有两个数据帧。列名称与这些数据帧相同。我想从数据帧中总结相同列的浮点值然后我可以使用
df3 = df1.add(df2)
但是,我的数据框包含两个字符串列。这些字符串也被添加。如何使代码不添加字符串,而是将float添加到两个数据帧中。两个示例数据帧如下所示:
df1 = pd.DataFrame(dict(Team=['A','B','C','D'],Value=[1,2,3,4]),index=[0,1,2,3])
df2 = pd.DataFrame(dict(Team=['A','B','C','D'],Value=[3,1,2,4]),index=[0,1,2,3])
当我使用df3 = df1.add(df2)
时,它还在“Team”列中添加了字符串,如下所示:
Team Value
0 AA 4
1 BB 3
2 CC 5
3 DD 8
如何在不添加Team但是Value的情况下编写代码。
谢谢,
泽普
使用团队名称作为索引而不是整数索引:
In [2]: df1 = pd.DataFrame(dict(Team=['A','B','C','D'],Value=[1,2,3,4])).set_index('Team')
...: df2 = pd.DataFrame(dict(Team=['A','B','C','D'],Value=[3,1,2,4])).set_index('Team')
In [3]: df1 + df2
Out[3]:
Value
Team
A 4
B 3
C 5
D 8
如果您有多个其他列,只需对列进行求和:
total = df1['Value'] + df2['Value']
此外,如果你需要一个与df1
和df2
相同形状的数据框,并用Value
替换为总和,你可以做
df3 = df1.copy()
df3['Value'] = total