我想用与国家/地区有关的条件来填充缺失的值:例如,我想用年龄平均值代替中国的缺失值,而在美国,这是年龄中位数。目前,我不想触及欧盟缺失的价值观。我该怎么实现呢?在数据框下方
import pandas as pd
data = [['USA', ], ['EU', 15], ['China', 35],
['USA', 45], ['EU', 30], ['China', ],
['USA', 28], ['EU', 26], ['China', 78],
['USA', 65], ['EU', 53], ['China', 66],
['USA', 32], ['EU', ], ['China', 14]]
# Create the pandas DataFrame
df = pd.DataFrame(data, columns = ['Country', 'Age'])
df.head(10)
Country Age
0 USA NaN
1 EU 15.0
2 China 35.0
3 USA 45.0
4 EU 30.0
5 China NaN
6 USA 28.0
7 EU 26.0
8 China 78.0
9 USA 65.0
10 EU NaN
谢谢
不确定这是否是最好的方法,但这是一种方法
IIUC,我们可以创建一个函数来处理此问题,因为它不容易自动化(尽管我可能错了)
也许您可以试试这个