missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

R如何根据上下文填写缺少的日期

我已经创建了一个生存数据库,该数据库描述了实验单位的生存(模块编号)。我想做的是在Date.y中用...

回答 1 投票 2

如果满足条件则用新值替换值,如果不满足则用R保持值相同

我正在使用一个数据集,其中变量的缺失值用特定数字指定。我正在尝试创建一个数据框,在其中我将这些值替换为空白,而另一个数据框...

回答 3 投票 2

使用现有列数据的计算来填充丢失的数据

遇到一个小问题。在UCI机器学习存储库(特定于ILPD)上工作。一列中有4个缺失值。而不是用均值或中位数来估算,它可以工作...

回答 1 投票 0

过滤每个条件少于4个NA的行

我有一个庞大的蛋白质组学数据集,其中包含14个样品(列)和3000+种蛋白质(行)。没有添加有关样本属于两个条件中的哪一个的信息。大约50%的数据是...

回答 1 投票 0

R用na.locf替换缺失值

我是R的新手。我希望替换数据中X的缺失值。对于相同的“ ID”,如何将“时间” = 1和2时缺少的“ X”值替换为“ X”时的“ X”值...

回答 3 投票 1

Pandas数据帧中的行空NULL计数

将pandas作为pd导入,将numpy作为np df = pd.DataFrame({'a':[1,2,3,4,np.nan],'b':[1,2,np.nan,4, np.nan],'c':[np.nan,2,np.nan,4,np.nan]})#df = ...

回答 1 投票 0

生成libffm.txt文件作为字段分解机(xLearn)的输入时处理NaN和缺失值

我正在设置现场分解机(xLearn),输入是具有NaN的类别变量。我的问题是:将缺失值输入到...

回答 1 投票 0

如何用Pandas中的分组模式替换缺少的值?

这是我的第一篇帖子,因此,如果我对政策犯了一个错误,我深表歉意。好的,所以我有一个销售数据集,其中特别包含2个字段“ Item_Identifier”和“ Item_Weight”。 ...

回答 1 投票 0

对于大的缺失,插补与对随机森林的可用子集进行训练相比有什么优势?

我想在缺失较大的数据集上训练随机森林模型。我知道“标准方法”,即我们在训练集中估算缺少的数据,对...

回答 1 投票 1

如何重复倍数值的日期并在SQL中填写缺失的日期

我有一个包含日期,ID和值的表,看起来像这样,我要为所有ID重复日期范围(开始日期,结束日期),如果缺少任何日期的值,请输入0。实现...

回答 2 投票 0

将嵌套模型与R中的NA进行比较

我正在尝试使用R中的anova()函数来比较嵌套回归模型,但是由于级别1和级别2模型由于缺少观测值而在数量上有所不同,因此遇到了问题...

回答 1 投票 1

为R中的过去日期添加缺失的行(例如,美国县的NYT冠状病毒病例数据集)

我目前正在使用美国县的《纽约时报》冠状病毒数据集。它按日期设置格式,这样可以在任何给定日期仅输入病例数大于1的县。因此对于日期(1/21)...

回答 1 投票 0

snakemake在作业完成后丢失输出异常

我正在通过snakemake运行DASTool,由于某种原因,尽管我得到了出纸槽,但以下错误使我们无法正常工作。由于我有输出,这是一个小麻烦,但它会杀死我的snakemake运行...

回答 1 投票 0

我如何根据另一个变量的缺失值返回ID列表?

自从我使用R道歉以来,问了这么一个基本问题已经有一段时间了:s我有一个变量,该变量在基线,4个月和12个月时具有相同ID的数据。我本质上是...

回答 1 投票 0

缺少适用于pandas数据框列的函数

我正在尝试将一个函数应用于“年龄”和“区域”列,以获取我在“所需”列中显示的结果。不幸的是,这种功能给我带来了错误。我知道还有其他...

回答 1 投票 0

如何填充一列中与另一列相关的缺失值?

我的数据集具有标记为“城市”,“邮政编码”,“邻居”的列。我具有“邻居”的所有值,但缺少城市和邮政编码的某些值。如何匹配“邻居” ...

回答 1 投票 0

MySQL计算空值

我正在尝试计算变量的特定结果。它是区域数据,我那里有缺失,我相信在尝试计算比率时会被忽略。选择日期计数(当区域位于...

回答 1 投票 0

如何处理线性回归中的缺失值?

我有一个包含60个变量的数据框,并且所有变量都缺少值,以至于没有一行是完整的:complete.cases(data)[1]否否否否否否否否否......>] >

回答 1 投票 0

缺少10的数据缺少填充NAN

df = pd.DataFrame({'From_To':['LoNDon_paris','MAdrid_miLAN','londON_StockhOlm','Budapest_PaRis','Brussels_londOn'],'FlightNumber':[10045,np.nan,10065,np。 nan,10085],'RecentDelays':[[23,47] ...

回答 1 投票 0

是否要删除数据框中数据缺失的行?

我正在尝试在rodham :: emails中随时间(emails $ docDate)绘制电子邮件主题(emails $ subject)中定义的术语(x)的频率。问题是无论如何我都得到相同的情节...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.