我有一个带有以下列的数据框:文件夹号,文件名,Val_Indices和Final_Result。Val_Indices和Final_Result可以采用值:0、1或2
样本数据
+---------------+-----------+-------------+--------------+
| Folder_Number | File_Name | Val_Indices | Final_Result |
+===============+===========+=============+==============+
| 100 | ABC.png | 0 | 1 |
+---------------+-----------+-------------+--------------+
| 100 | DEF.png | 0 | 0 |
+---------------+-----------+-------------+--------------+
| 100 | EFG.png | 0 | 1 |
+---------------+-----------+-------------+--------------+
| 200 | HIJ.png | 1 | 0 |
+---------------+-----------+-------------+--------------+
| 200 | KLM.png | 1 | 1 |
+---------------+-----------+-------------+--------------+
| 300 | NOP.png | 2 | 2 |
+---------------+-----------+-------------+--------------+
我希望将数据按Folder_Number进行分组,并且与该Folder_Number相对应的所有行的Final_Result值应为该组中值的最小值。
例如,对应于Folder_Number = 100
,我希望文件夹编号100的所有行都具有Final_Result = 0
(最小值为1,0,1)。
类似地,对应于文件夹号200,所有行都应具有Final_Result = 0
(0和1的最小值)。
对应于文件夹编号300,所有行都应具有Final_Result = 2
(文件夹300仅具有1 Final_Result
值)
您可以做
df['Final_Result'] = df.groupby('Folder_Number')['Val_Indices'].transform(min)