如何填充相对于另一列中的值的缺失值

问题描述 投票:1回答:3

我想用与国家/地区有关的条件来填充缺失的值:例如,我想用年龄平均值代替中国的缺失值,而在美国,这是年龄中位数。目前,我不想触及欧盟缺失的价值观。我该怎么实现呢?在数据框下方

import pandas as pd
data = [['USA', ], ['EU', 15], ['China', 35],
       ['USA', 45], ['EU', 30], ['China', ],
       ['USA', 28], ['EU', 26], ['China', 78],
       ['USA', 65], ['EU', 53], ['China', 66],
       ['USA', 32], ['EU', ], ['China', 14]]  

# Create the pandas DataFrame 
df = pd.DataFrame(data, columns = ['Country', 'Age'])
df.head(10)

  Country   Age
0     USA   NaN
1      EU  15.0
2   China  35.0
3     USA  45.0
4      EU  30.0
5   China   NaN
6     USA  28.0
7      EU  26.0
8   China  78.0
9     USA  65.0
10    EU    NaN

谢谢

python-3.x pandas missing-data
3个回答
0
投票

不确定这是否是最好的方法,但这是一种方法


0
投票

IIUC,我们可以创建一个函数来处理此问题,因为它不容易自动化(尽管我可能错了)


0
投票

也许您可以试试这个

© www.soinside.com 2019 - 2024. All rights reserved.