我正在尝试对数据帧进行分组,以获得每个“pid”的最小“vid”值。(每个“pid”有多个“vid”,我想保留每个“pid”的最低值)。
问题是我需要数据框中的输出,而 groupby 操作将我的输出更改为一系列。即使我尝试使用“to_frame()”改回数据帧,形状也会显示 1 列而不是 2 列。它将“pid”视为索引。
hf_patients_min_visit=filtered_hf_patients.groupby('pid')['vid'].min()
hf_patients_min_visit.to_frame()
这是你需要使用
reset_index()
功能的地方:
hf_patients_min_visit=filtered_hf_patients.groupby('pid')['vid'].min()
hf_patients_min_visit.reset_index()