遇到一个小问题。在UCI机器学习存储库(特定于ILPD)上工作。一列中有4个缺失值。可以使用现有列数据中的简单公式来计算平均值,而不用平均值或中位数来估算。
[尝试使用以下公式白蛋白/(总蛋白-白蛋白)填写白蛋白球蛋白比率的缺失数据,但是以下代码始终会出错。
IndianLiver['Albumin Globulin Ratio']
.fillna(IndianLiver.groupby('Class')['Albumin Globulin Ratio']
.transform(['Albumin']/(['Total Proteins']-['Albumin']), inplace=True)
SyntaxError: unexpected EOF while parsing
有什么想法吗?
谢谢
设法解决它,似乎在最后的计算中调用的列上缺少数据框名称:
Albumin_Globulin_Ratio = IndianLiver['AG Ratio'].fillna(IndianLiver['Albumin']/(IndianLiver['Total Proteins']/IndianLiver['Albumin']))
现在,这将使用现有列来填充列中的4个缺失数据点,以计算缺失数据点。