我已经将两个不同的数据集合并到一个 DataFrame 中,如下所示。
日期 | 身份证号码 | A_1 | A_2 | B_1 | B_2 | C_1 | C_2 |
---|---|---|---|---|---|---|---|
2024年1月1日 | 1 | 1 | 3 | 4 | 9 | 8 | 9 |
2024年1月1日 | 3 | 9 | 8 | 7 | 4 | 3 | 2 |
2024年1月1日 | 6 | 10 | 20 | 30 | 40 | 50 | 60 |
在上表中,列 A_1、B_1、C_1 来自数据集 1,列 A_2、B_2、C_2 来自数据集 2。 现在我想计算列 A_1、A_2、B_1、B_2、C_1、C_2 与 ID 列之间的绝对差,因为它在两个数据集中都是唯一的。 为此,我到目前为止所拥有的是
columns = [A_1, A_2, B_1, B_2, C_1, C_2]
for col in columns:
diff = np.abs(df[f'{col}_1] - df[f'{col}_2])
results_df[col] = [f"{round(diff)}"]
上面的代码给我的结果在列之间有绝对差异,但我想添加 ID 列作为第一列。我该怎么办?
我已将其添加到代码中:
results_df['DATE'] = df['DATE']
results_df['ID'] = df['ID']