missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

分类变量计数记录的可视化,包括其缺失值(“None”或“NaN”)

假设我有以下时间序列数据数据框: 将 numpy 导入为 np 将 pandas 导入为 pd 随机导入 np.随机.种子(2019) # 生成TS #rng = pd.date_range('2019-01-01', freq='MS', 每...

回答 1 投票 0

将列中的 NA 替换为日期列中最接近的 NA,将非 NA 替换为 R 中的条件

我有一个类似于下面的数据框 - 我的实际数据更大且分组 - 并且想知道如何将 NA 与最接近的非 NA 插补为整数变量,就日期而言,即......

回答 1 投票 0

如何检测 R 中长格式数据集中特定组的缺失字符串值?

我正在使用 R 中的长格式数据集,其中有多个组和一列表示季节的字符串(2020 年秋季、2021 年冬季、2021 年夏季、2021 年秋季等)。我希望每个小组都有

回答 1 投票 0

识别 R 数据框中缺失的国家/地区

我有一个数据框,其中包含带有各种国家名称的“国家”列。 我想找出哪些国家(例如联合国成员国)失踪了。 有什么快速的方法可以做到吗...

回答 1 投票 0

替换分类数据中的缺失值

假设我有一列包含分类数据“红色”“绿色”“蓝色”和空单元格 红色的 绿色的 红色的 蓝色的 南 我确定 NaN 属于红绿蓝,我应该用 av 替换 NaN...

回答 3 投票 0

从存在缺失值的现有列创建新列

我正在尝试根据这两列创建一个新列。假设我想创建一个新列 z,当它不丢失时它应该是 y 的值,当 y 确实丢失时它应该是 x 的值....

回答 6 投票 0

如何生成日期时间值来填补数据空白

我正在尝试填补气象站数据表中的空白,问题是我的数据表没有用于数据丢失的地方的空单元格,它只是从 2023-04-07 10:30 跳转到 2023-04 ...

回答 1 投票 0

为什么 pandas 使用 numpy 中的“NaN”,而不是它自己的 null 值?

这是一个宽泛的话题,但我会尝试将其简化为一些具体问题。 在开始回答有关 SO 的问题时,我发现自己有时会遇到这样的愚蠢错误:

回答 3 投票 0

SAS 中带有 id 的两列中的日期范围缺少年份数据

我有以下格式的数据 开始日期 perm_id 金额 结束日期 2004 年 7 月 1 日 4294970232。787560 2009 年 7 月 1 日 2005年8月10日 4294970232 797880 2009年7月1日 2007 年 1 月 31 日...

回答 1 投票 0

将系统缺失值重新编码到 SPSS 中的同一变量中

我正在尝试将系统缺失值重新编码到SPSS中的同一变量中,该变量是日期,格式是dd-mmm-yyyy。 (mmm 例如是八月或二月等)所以我所做的是:变换 >

回答 1 投票 0

如何将编码缺失值替换为rapidminer中的缺失值?

我目前正在使用 COVID-19 数据集中的数据集进行 covid 数据分析。我在这个项目中使用 Rapidminer。 在此数据集中,缺失值在所有其他

回答 1 投票 0

如何在 R 中有条件地迭代替换 NA 值

我需要将 i 列中的 NA 值替换为 i+43 列中包含的值,并对 R 数据框中的所有 i 列执行此类操作。 假设我们有以下 R 数据框...

回答 1 投票 0

Snakemake 中缺少输出异常错误

我使用的是snakemake版本7.30.1 我正在尝试使用snakemake --cores 4运行我的snakemake工作流程。Snakemake似乎能够找到输入文件并且似乎开始完成这些步骤...

回答 1 投票 0

使用子集数据帧更新具有某些缺失值的数据帧

我正在尝试用较小的子集更新 pandas 中数据帧的缺失值,但似乎无法让 pd.merge、df.loc 或 pd.join 工作。 场景是这样的:我有一个 Dataframe df ...

回答 1 投票 0

用因子水平替换一系列变量中的NA

这是我的数据,我想将 NA 替换为“否”。我可以一一替换缺失值。但是,我需要替换代码中 s_1:s_4 中的 NA。提醒一下,所有变量...

回答 2 投票 0

我可以仅对用 R 中的 MICE 估算的数据集的子样本进行汇总回归分析吗?

我使用 R 中的“mice”包进行了多重插补。之后,我使用“with”和“pool”函数计算了汇总回归分析。 为了进一步分析,我只想看看...

回答 1 投票 0

pandas:向数据帧添加缺失值

您好!我有输入数据 df = pd.DataFrame({'w':[1,1,2,2,2,3,3,3,4,4,4], '用户':['用户2','用户3','用户1','用户1','用户2','用户2','用户2','用户3','用户1','用户1','用户3'], ...

回答 1 投票 0

如何按组查找 data.frame 列中的缺失值,并将所有值(缺失值和找到值)附加到 R 中的结果 data.frame 中?

如何在R中从sample_data(没有循环)创建desired_data? 样本数据: 样本数据1 <- data.frame(group=c("L1","L1","L1","L1","L1",&...

回答 1 投票 0

从另一个 DF 填充 DF 的 NaN/缺失数据

我有两个数据框: DF1[name] 的所有 NaN 必须通过匹配“Group”由 DF2[name] 填充。可按“重复”次数重复匹配和填充。 期望的输出: 也在寻找最快的跑步...

回答 1 投票 0

如果其他列中的行相同,请填写缺失值

我有一张表格,如下所示: 姓名 地区 ID 姓名1 我们 123 姓名1 我们 姓名2 我们 122 姓名3 我们 124 姓名1 英国 姓名1 英国 135 姓名2 英国 140 姓名3 我们 正如你所看到的,有空值...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.