我有一个包含权重列的数据集,我想在调整这些权重时对其进行子集化以使其代表原始数据集。
假设我有数据框:
data.frame(Age=c(10,20,30,25,50,60,40),
Country=c("Germany","Germany","Germany","China","China","China","China"),
Class=c("A", "B", NA, NA, "B", "A", "A"),
Weight=c(1.1, 0.8, 1.2, 1.7, 0.7, 1.3, 0.9))
我想删除
NA
列中的Class
行,并更新Weight
列以保持我的样本代表原始数据集给定Age
和Country
列。 (上面的数据框对于这样的问题可能太小了,但这只是为了说明)。
df.fillna(df.mean())
如果想用平均值或其他特定值填充 Na 值,您只需运行此代码即可。
data.fillna()
用于填充 pandas dataframe 中的 nan 值,你可以将任何你想要替换的值放入