missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

如何用该组平均值填充非整数,并用0替换所有NaN组

我想对以下数据集进行特殊的fillna(),如下所示:name,spend,received A,1012,1200 A,?,1500 B,1300 ,? B,2000,2500 B,?,? C,?,? C,?,?在这个数据集中?表示任何非整数值...

回答 3 投票 -1

如何处理房地产数据中的缺失值?

我正在使用属性数据集,并且正在尝试处理Land Square Feet Column中的缺失值。数据集中几乎有160000条记录。其中70000条记录丢失...

回答 1 投票 0

如何处理R中的NaN值?

我正在测试随机截距,以为增长曲线建模做准备。因此,我首先创建了一个宽子集,然后将其转换为Long数据集。计算我的ModelM1

回答 1 投票 -1

我如何遍历时间列表,找到跳过/错过的时间,然后填写该时间?

我每天有12分钟的文件清单。我应该有120个文件,但我只有114个文件。这意味着有6、12分钟的丢失数据/文件时间。我用日期时间创建了一个数组...

回答 2 投票 1

如何根据分组平均值填充缺失值?

我的数据缺少“年龄”的值,我想根据“分组”列的“平均值”将其平均替换。命令后:df.groupby('Title')。mean()['Age']我得到一个列表,例如Mr 32 ...

回答 1 投票 0

R:用两个不同的值替换缺失值(NA)

我可能使事情变得过于复杂-很想知道是否有更简单的方法来解决这个问题。我有一个数据框(df),包含5654个观测值-1332年是外国出生的,而4322年是加拿大出生的...

回答 2 投票 0

根据另一列的唯一ID填充缺失值

我有一个带有用户ID和设备型号值的数据框该用户ID对于每个用户都是唯一的,但是多次登录有重复项,并且设备型号没有丢失的值...

回答 1 投票 0

Pandas:合并具有混合数据类型的列

我有主数据帧和辅助数据帧。当ID变量组合相同时,我想用辅助数据帧中的值替换主要数据帧中的值。 ID之一...

回答 1 投票 0

如何跟踪熊猫数据框中已更改的列

我正在执行大量数据清理,并希望跟踪已操纵的行。是否有一种优雅的方式来跟踪我所做的更改(理想情况是在...

回答 1 投票 0

如何使用python过滤丢失的数据行

我有一个数据框df,名为mort_acc的功能之一缺少数据。我想过滤掉那些包含mort_acc缺少数据的行,并使用以下方式df [df ['mort_acc'] ....

回答 4 投票 -2

摆脱NA数据点以创建箱线图

我正在尝试摆脱这套并排箱形图的幻影箱形图。我知道这是由于缺少性别数据造成的,但是,我无法弄清楚我在代码中插入的位置是!....

回答 2 投票 1

R-去除NA数据点以创建箱线图

我正在尝试摆脱这套并排箱形图的幻影箱形图。我知道这是由于缺少性别数据造成的,但是,我无法弄清楚我在代码中插入的位置是!....

回答 2 投票 0


处理缺少的分类值ML

我已经完成了替换分类数据中的缺失值的操作,这与处理分类数据中的缺失值有关。数据集约有6个类别列,缺少值。这将用于...

回答 1 投票 0

处理用于ML分类的列中的无穷大值

[使用公式计算列(公式不涉及任何日志函数,仅与.sum()分组),但正如预期的那样,此列将产生无限/指数值,如下所示:-inf ...] >

回答 1 投票 0

如何处理R中for循环中的丢失数据(NA)

我正在尝试为观察和模拟的数据计算卡方差,并使用贝叶斯推断评估模型的拟合度。观察到的数据集包含缺失(“ NA”)值。但是,...

回答 1 投票 1

PySpark数据框在所有列上向前填充

我有以下问题。我有一个跟踪状态变化的数据集。 id有效事件日期1错误2020-05-01 1正确2020-05-06 2正确2020-05-04 2错误2020-05-07 2 ...

回答 1 投票 1

[更新mysql表后仅在单个列中丢失数据

我是jsp servlet的新手。我正在用Eclipse和mysql做一个jsp,servlet CRUD项目。插入,删除操作是可以的,但是当我更新employee表的一行上的数据时,userName的数据...

回答 1 投票 0

Python中的R鼠标包

我正在尝试通过Jupyter在Python上运行R鼠标包。我正在努力解决许多错误和技术问题。让我们以虹膜数据集为例,并插入一些na:将numpy导入为np,将熊猫导入为pd ...

回答 1 投票 1

如何处理应该在Python中丢失的缺失值(不应对NaN进行插值)?

我正在研究一个项目,该项目根据许多变量来模拟人的幸福感变化。大多数解释变量是每天的(他们吃了多少食物,每天运动,睡觉等……),但是...

回答 1 投票 -1

© www.soinside.com 2019 - 2024. All rights reserved.