missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

条件缺失值插补与另一列的频率/模式

我有一个包含“id”、“x1”列的数据框。我想将“x1”中缺失的值替换为“x1”中相应“id”的最常见值。 例如,缺失值存在于...

回答 1 投票 0

纵向/面板数据中的 NAs

我在小组中处理 NA。我有五个国家,同一个变量在五年内测量 设置种子(100) 政策.1 <- data.frame(country= c("A","B","C&qu...

回答 1 投票 0

Databricks 缺失值未出现在计数中

在 Databricks 中执行的所有步骤。 我已经在 Databricks 中加载了我清理过的数据集,并且变量在摘要或 colSums(is.na(df)) 命令中没有显示任何缺失。我知道他们...

回答 0 投票 0

随机森林中的分类

如何在随机森林中进行包含缺失值的分类?我的计划是在不先进行数据预处理过程的情况下进行分类。我有困难...

回答 0 投票 0

具有缺失值的谋杀数据

我有一个关于巴西杀戮女性的数据集。这些列是州、type_of_crime、年份、数量 deaths_100K_pop。数量上有一些缺失值,我想用平均值填充这些值......

回答 1 投票 0

Pandas to_csv 但在不删除整行或整列的情况下删除单个单元格级别的 NaN

我有一个调查评论的数据框。我想将数据框导出为 csv 文件并删除 NaN 而不删除任何行或列(例如,除非整行都是 NaN)。这里...

回答 1 投票 0

如何将栅格中的多个值替换为 NA 并将输出文件保存在输出目录中?

我有多个.tiff图像,例如 20000101 20000113 20000124 . . . 20201224 (格式为 yyyymmdd) 栅格文件可能包含 65533、65534 和 65535 个值作为缺失数据。我想更换...

回答 1 投票 0

仅当“夹在”相同值时才填充缺失

我在 R 和 Python 中看到了这方面的问题(例如,仅当使用 dplyr 将相同值“夹在中间”时才填充 NA),但无法在 Stata 中找到如何执行此操作的答案。 我想...

回答 1 投票 0

TypeError:输入类型不支持 ufunc 'isnan',并且无法安全地强制输入

我正在尝试将 csv 转换为 numpy 数组。在 numpy 数组中,我用 NaN 替换了几个元素。然后,我想在 numpy 数组中找到 NaN 元素的索引。代码是:

回答 8 投票 0

如何读取第一列仅包含数字的 csv 文件?也就是我只想导入具有 id

你们在图片中可以看到,我从我的教授那里收到的论文数据集有点乱...... 我现在正试图将它读入 python 但由于未开发而遇到了很多问题...

回答 0 投票 0

这个错误在 SPSS 中对于缺失值意味着什么?

我正在研究急诊室患者的流行病学学位。我有一个 SPSS 数据集,其中包含 46 个变量(列)和 19228 名患者(行),这些患者由患者编号定义。优化...

回答 0 投票 0

R中的MatchThem包中的余额检查

我正在使用 R 中的 MatchThem 对缺失数据进行逆概率处理加权 (IPTW)。在生成来自多个估算数据集(例如 m=5)的加权数据集后,我...

回答 1 投票 0

如何将栅格中的多个值替换为 NA?

我有多个.tiff图像,例如 20000101 20000113 20000124 . . . 20201224 (格式为 yyyymmdd) 栅格文件可能包含 65533、65534 和 65535 个值作为缺失数据。我想更换...

回答 1 投票 0

如何在R中通过分组包围均值来填充NA

我真的不知道如何通过按组计算其周围环境的平均值来填充NA。换句话说,我不希望其他组中的数据计算在周围的平均值中。 我有一个...

回答 1 投票 0

Stata - 仅当“夹在”相同的值时才会丢失填充

我在 R 和 Python 中看到了这方面的问题(例如,仅当使用 dplyr 将相同值“夹在中间”时才填充 NA),但无法在 Stata 中找到如何执行此操作的答案。 我想...

回答 1 投票 0

R 函数中的相对引用观察

在编写一个函数来计算向量中的每个观察值时,我如何引用所述观察值以包括距离预定数量的观察值的观察值单元格...

回答 4 投票 0

扩展 SELECT 中缺失的数据

我有以下设置的数据: ID 日期 价值 1个 17.01.2023 坏的 1个 17.01.2023 好的 1个 18.01.2023 足够的 1个 17.01.2023 好的 1个 15.03.2023 坏的 1个 2023 年 3 月 20 日 好的 2个 2023 年 1 月 10 日 坏的 2个 19.01.2023 够了……

回答 2 投票 0

Scikit 学习迭代输入器:更改和缩放公差

作为学校项目的一部分,我必须在给定的数据库上探索和执行数据分析和机器学习方法。关键是我的数据库很大(12 651 行 810 列)...

回答 0 投票 0

如何在一年中的每个小时显示 R 中的日期列

我有一个信息数据框,包括各个节点的每小时平均值,但是当缺少一个小时时,它只会跳过该行。 我怎样才能让每个节点都有相同数量的 r ...

回答 1 投票 0

如何在使用 LabelEncoder + Iterative Imputer 进行插补后取回分类数据?

我正在尝试为分类数据列估算缺失值,我已成功估算它们但现在我想将它们改回分类,该怎么做? 我用过 labelencoder 和

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.