我有一个包含超过 4 列的 pandas 数据框。 col1 中的某些值丢失,我想根据以下方法设置这些丢失的值:
最好的方法是什么?
根据您的逻辑,您可以执行以下操作,其中
fillna
的每一行对应于您问题中的一个项目符号点,顺序相同:
df['col1'] = (df['col1']
.fillna(df.groupby(['col2','col3','col4'])['col1'].transform('mean'))
.fillna(df.groupby(['col2','col3'])['col1'].transform('mean'))
.fillna(df.groupby(['col2'])['col1'].transform('mean')
.fillna(df['col1'].mean())
)
--- 用零填充 null 空值
df_with_dummies.fillna(值= 0,就地= True)