imputation 相关问题

缺少数据插补是用替换的“最佳猜测”值替换缺失数据的过程。由于缺失数据可能会产生分析数据的问题并可能导致数据丢失,因此估算是一种避免与列表删除相关的问题的方法(忽略所有缺失值的观察结果)。

sklearn 的 KNN Imputer 可以处理数据框中的特定行吗?

我有一个包含一些 NaN 值的 pandas 数据框,我正在尝试使用 KNN 填充器来填充它们。我希望输入器根据特定参数选择“邻居”,在这种情况下它应该只

回答 1 投票 0

使用没有记录事件的小鼠进行多次插补后,数据包含缺失值(即,没有常数值或多重共线性的证据)

使用mice包进行多重插补(pmm方法)后,我的数据集中仍然存在缺失值(尽管缺失值的数量减少了)。 我检查过没有...

回答 0 投票 0

R。具有插补数据的线性模型

我目前正在使用两个数据框,并尝试使用小鼠插补进行线性模型分析。然而,当尝试使用函数 geeglm 进行分析时,似乎

回答 0 投票 0

使用 Hmisc 包将系列参数传递给 fit.mult.impute 以使用修改后的泊松进行多重插补时出现问题

我之前能够使用通过 Hmisc 包多重插补创建的数据来运行修改后的泊松回归。我一个月前运行代码没有问题,但现在遇到了问题

回答 0 投票 0

使用 Rstudio 中的 R 插值来估算一天中每个小时的个体级别缺失数据的最佳方法是什么?

我有一个数据面板,其中包含 3 年观察到的一年中 5 个月的数据。我们在这些时期观察到了许多人。问题是很多人都...

回答 0 投票 0

早年时间序列差异时用缺失值估算时间序列的最佳方法

我正在构建一个具有内生和外生时间序列变量的 VARMAX 模型。数据集包含 1950-2019 年的所有时间序列变量,除了一个不是

回答 0 投票 0

这个数据有偏差吗

我正在学习机器学习,我遇到了处理缺失数据的问题。它说如果数据有偏差,建议使用中值插补。我尝试绘制我的数据,这就是结果......

回答 0 投票 0

多重插补后(当结果和中介都是二元的时)如何对因果中介分析做敏感性分析?

我希望使用中介包 (https://cran.r-project.org/web/packages/mediation/mediation.pdf) 对已经估算的数据进行一些敏感性分析。好像没有

回答 0 投票 0

如何将汇总插补回归结果添加到 stargazer 表

我在我的数据中估算了一些 NA,计算了一个回归模型,并希望在 HTML 表格中显示结果。我知道如何为常规模型执行此操作。 图书馆(观星者) mydf<- ir...

回答 1 投票 0

如何在 miceadds 中使用 ml.lmer 方法估算数据

我正在尝试应用 ml.lmer 将缺失数据归因于以下数据框 dt =结构(列表(f = c(“3”,“3”,“3”,“3”,“3”,“3”,&

回答 0 投票 0

KNN imputer 具有标称、序数和数值变量

我有以下数据: # 图书馆 将熊猫导入为 pd 将 numpy 导入为 np 从 sklearn.impute 导入 KNNImputer 从 sklearn.preprocessing 导入 OneHotEncoder,OrdinalEncoder 来自 sklearn.metr ...

回答 0 投票 0

如何估算 NA 值或创建所有可能的组合?

data.frame( group = c("a", "b", "c", "d", "e", "总计"), 计数 = c(NA, NA, 10, 21, 49, 85) ) > 组数 1个不适用 2 ...

回答 1 投票 0

R 中的 mice 包/函数抛出一个我不明白的 lm.fit 错误

我正在尝试使用 mice 包来估算大型数据集。有 14 个变量有缺失值,我需要 mice() 函数来估算,但是当我尝试使用该函数时,它保持

回答 0 投票 0

计算小鼠估算数据的平均值

我想计算小鼠中估算数据集的个体水平平均值(用于展示目的,不用于分析)。例如,如果我有以下缺少的数据集。 ...

回答 3 投票 0

LDA中缺失值的填补

我想展示我的结果中的 PCA 和 LDA 图,基于根据一个分类变量分布的 140 个个体。在这个个体中,我测量了 50 个变量(基因表达)。对于...

回答 0 投票 0

如何在R中通过分组包围均值来填充NA

我真的不知道如何通过按组计算其周围环境的平均值来填充NA。换句话说,我不希望其他组中的数据计算在周围的平均值中。 我有一个...

回答 1 投票 0

如何使用 CLEVELS 语句为 SAS 9.4 中的 surveyimpute 函数指定我的类级别?

我正在使用以下代码: ***疑难解答***; PROC surveyimpute DATA=data_Impute METHOD=FEFI varmethod=jackknife;类人 HH (CLEVELS=(1 2 3 4 5 6 7)); VAR人HH;地层 sdmvstra;集群

回答 0 投票 0

如何解释Hmisc包中aregImpute()的结果以及如何确定NK值?

我刚刚查看了Hmisc包中aregImpute()函数的文档,示例如下: # 示例 1:样本量大,缺失数据多,无重叠 # NA 跨变量...

回答 0 投票 0

使用简单输入器的正确方法?

我有一个带有 nan 值的测试和训练数据集。我想使用简单的 imputer 以便使用以下代码处理它们。 #数值 imp= SImp(strategy= 'median') #or 'mean...

回答 2 投票 0

如何在使用 LabelEncoder + Iterative Imputer 进行插补后取回分类数据?

我正在尝试为分类数据列估算缺失值,我已成功估算它们但现在我想将它们改回分类,该怎么做? 我用过 labelencoder 和

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.