使用现有列数据的计算来填充丢失的数据

问题描述 投票:0回答:1

遇到一个小问题。在UCI机器学习存储库(特定于ILPD)上工作。一列中有4个缺失值。可以使用现有列数据中的简单公式来计算平均值,而不用平均值或中位数来估算。

[尝试使用以下公式白蛋白/(总蛋白-白蛋白)填写白蛋白球蛋白比率的缺失数据,但是以下代码始终会出错。

IndianLiver['Albumin Globulin Ratio']
.fillna(IndianLiver.groupby('Class')['Albumin Globulin Ratio']
.transform(['Albumin']/(['Total Proteins']-['Albumin']), inplace=True)

SyntaxError: unexpected EOF while parsing

有什么想法吗?

谢谢

missing-data fillna
1个回答
0
投票

设法解决它,似乎在最后的计算中调用的列上缺少数据框名称:

    Albumin_Globulin_Ratio = IndianLiver['AG Ratio'].fillna(IndianLiver['Albumin']/(IndianLiver['Total Proteins']/IndianLiver['Albumin']))

现在,这将使用现有列来填充列中的4个缺失数据点,以计算缺失数据点。

© www.soinside.com 2019 - 2024. All rights reserved.