missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

模型的结果是否适合将多次推算的数据集提取到数据帧?

是否有可能从数个模型中提取出适合乘以推算数据的汇总估计值?下面是我如何为完整的案例数据框执行此操作(即没有丢失数据) - ...

回答 1 投票 1

我的数组printf循环最后缺少一个数字

我试图通过这个程序将十进制转换为二进制,但输出始终缺少最后一位数。例如,我将输入“123”作为商,结果将是“111101”而不是“...

回答 2 投票 4

在Python / Pandas中读取空格分隔文件,缺少值

我正在尝试使用来自panda的read_csv在Python中读取空格分隔文件。它的工作原理是指定delimiter =“”。当列中存在某些缺失值时会出现问题,因为它...

回答 1 投票 1

熊猫:在事件发生时填充缺失值

我已经问了一个类似的问题(见这里),但不幸的是它还不够清楚,所以我决定用一个更好的数据集创建一个新的例子和一个新的解释...

回答 2 投票 0

即使屏蔽,NaN在预期值中也会在重量矩阵中引入NaN

为了处理缺失的数据,我编写了以下模型并运行它。输出如下。为什么训练采用NaN期望值,由loss_0_where_nan(以及......)掩盖

回答 1 投票 3

将自定义函数应用于每一行仅使用参数的第一个值

我试图使用以下数据集在列的子集中将NA值重新编码为0:set.seed(1)df

回答 4 投票 5

spark-dataframe pivot缺少列/值

现在我面临一个我无法解决的问题,让我解释一下。我需要转动一个spark-dataframe,但在某些情况下,没有转轴的记录来包含我需要的列。这是 ...

回答 1 投票 1

处理主要损失的缺失数据,其中存在辅助损失

我想为具有主目标和辅助目标的数据集构建Keras模型。我有数据集中所有条目的辅助目标数据,但对于主目标,我只有数据...

回答 1 投票 1

R - 在重复的系列中找到缺少的元素

您如何找到应该(可预测地)存在于数据帧中但不存在的条目?我可能微不足道的问题类似于这个问题,但是还有一两层 - 每一个解决方案我......

回答 1 投票 0

通过从pandas数据帧中的非缺失值中随机选择来填充缺失数据

我有一个pandas数据框,其中有几个缺失值。我注意到非缺失值彼此接近。因此,我想通过随机选择来估算缺失值...

回答 4 投票 3

R Caret:NA没有缺失值时的错误

我正在尝试为没有缺失值的数据集运行分类算法。这是数据集描述:'data.frame':59977 obs。 6个变量:$性别:因子w / 2 ...

回答 1 投票 0

数据框中有多少行包含问号符号

我有从csv制作的数据帧,其中缺少的数据由?表示?符号。我想检查一下有多少行?发生次数。到目前为止,我做了这个,但它显示...

回答 1 投票 -1

如果NA中有太多NA,请删除R中的列[关闭]

我想编写一些代码来检查列中是否包含NA值,以及如果它优于某个值,那么该列将从另一个选项卡中删除。我有这个......

回答 2 投票 0

在Fortran中设计一个大型可压缩二进制浮点数

我想为netcdf文件中的4和8字节浮点变量设计一个“填充”值,以表示丢失数据的特殊情况。已经有一个恒定的NF_FILL_FLOAT和我的理解......

回答 1 投票 1

填补缺失的级别

我有以下类型的数据帧:国家/地区

回答 6 投票 12

Matlab:对缺失数据的多重插补

是否有任何包可用于多重插补?或者我可以用来编写自己的函数的任何引用?由于缺少数据的百分比在某些数据列中确实很高(...

回答 1 投票 0

如何插入NA行以填充列以创建完整的连续数据集

我目前有数据集:Time Var1 Var2 Cat 1 14 16 1 2 16 98 1 4 52 68 1 7 17 12 1 1 57 58 2 3 45 35 2 4 33 12 2 7 77 1 2并希望......

回答 2 投票 2

Python如何使用bfill方法填充自定义值(例如“#NA ####”)?

我有一个包含“#NA ####”的数据框。我想用组均值来回填这个值。我知道我可以先用np.NAN替换“#NA ####”,然后使用pd.fillna,但还有更方便的方法吗?

回答 1 投票 -1

使用R将值移到data.frame左侧[复制]

好的,所以我有这个data.frame:A B C 1黄紫色 2 黄色3橙黄色 4橙色 棕色5 ...

回答 1 投票 1

在python中显示给定开始日期和结束日期的缺失时间戳

数据集具有时间和温度值。还给出了开始和结束日期。 start_date = '22 -02-2018 10:35:29'end_date = '23 -02-2018 10:34:29'TIMESTAMP Temp1 Temp2 22-02-2018 14:......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.