pandas将多列相乘以生成新的df

问题描述 投票:1回答:2

我从两个数据帧开始 - 一个填充了一周中的虚拟变量,另一个填充了当天小时的假人(HE - 小时结束)。

df1 =星期几= n x m,其中n是观测数,m是6:

    Mon Tue Wed Thu Fri Sat
0   1   0   0   0   0   0
1   0   1   0   0   0   0
2   0   0   1   0   0   0
3   0   0   0   1   0   0

df2 =一天中的小时数= n x l,其中n是obs的数量,m是23:

    HE1 HE2 HE3 HE4 HE5 ... HE22 HE23
0   1   0   0   0   0   ... 0    0
1   0   1   0   0   0   ... 0    0
2   0   0   1   0   0   ... 0    0
3   0   0   0   1   0   ... 0    0

我想创建一个尺寸为n x(m次l)的新df,其中m乘以l = 6 * 23 = 138:

    MonHE1 MonHE2 MonHE3 MonHE4 MonHE5 ... SatHE22 SatHE23
0   1      0      0      0      0      ... 0       0
1   0      1      0      0      0      ... 0       0
2   0      0      1      0      0      ... 0       0
3   0      0      0      1      0      ... 0       0

我成功了:

hoursXdays = pd.DataFrame()
Mon = hours.multiply(days['Mon'],axis='index').add_prefix('Mon')
Tue = hours.multiply(days['Tue'],axis='index').add_prefix('Tue')
Wed = hours.multiply(days['Wed'],axis='index').add_prefix('Wed')
Thu = hours.multiply(days['Thu'],axis='index').add_prefix('Thu')
Fri = hours.multiply(days['Fri'],axis='index').add_prefix('Fri')
Sat = hours.multiply(days['Sat'],axis='index').add_prefix('Sat')
hoursXdays = pd.concat([Mon, Tue, Wed, Thu, Fri, Sat],axis=1)

我需要为更多的dfs做这个,而不仅仅是这几个。如果我有任何方式可以概括这一点,我会很感激帮助。

基本上,在pandas中有一种方法可以将两个数据帧维数n x m,n x l相乘,以得到一个新的df维数n x(m乘以l)?

python pandas
2个回答
3
投票

你可以在这里使用for循环

pd.concat([hours.multiply(days[x],axis='index').add_prefix(x) for x in days.columns],1)

1
投票

您可以使用itertools.productpd.DataFrame默认构造函数

d = {a[0]+b[0]: np.array(a[1])*b[1] for a,b in itertools.product(df.to_dict('list').items(), df2.to_dict('list').items())}

dff = pd.DataFrame(d)

MonHE1  MonHE2  ... SatHE22 SatHE23
0   1   0       ... 0       0
1   0   0       ... 0       0
2   0   0       ... 0       0
3   0   0       ... 0       0
© www.soinside.com 2019 - 2024. All rights reserved.