在Python中使用关键列查找绝对差异

问题描述 投票:0回答:1

我已经将两个不同的数据集合并到一个 DataFrame 中,如下所示。

日期 身份证号码 A_1 A_2 B_1 B_2 C_1 C_2
2024年1月1日 1 1 3 4 9 8 9
2024年1月1日 3 9 8 7 4 3 2
2024年1月1日 6 10 20 30 40 50 60

在上表中,列 A_1、B_1、C_1 来自数据集 1,列 A_2、B_2、C_2 来自数据集 2。 现在我想计算列 A_1、A_2、B_1、B_2、C_1、C_2 与 ID 列之间的绝对差,因为它在两个数据集中都是唯一的。 为此,我到目前为止所拥有的是

columns = [A_1, A_2, B_1, B_2, C_1, C_2]
for col in columns:
diff = np.abs(df[f'{col}_1] - df[f'{col}_2])
results_df[col] = [f"{round(diff)}"]

上面的代码给我的结果在列之间有绝对差异,但我想添加 ID 列作为第一列。我该怎么办?

python pandas spark-notebook
1个回答
0
投票

我已将其添加到代码中:

results_df['DATE'] =  df['DATE']
results_df['ID'] = df['ID']
© www.soinside.com 2019 - 2024. All rights reserved.