imputation 相关问题

缺少数据插补是用替换的“最佳猜测”值替换缺失数据的过程。由于缺失数据可能会产生分析数据的问题并可能导致数据丢失,因此估算是一种避免与列表删除相关的问题的方法(忽略所有缺失值的观察结果)。

在 R- 零膨胀泊松中使用 MICE 从多个估算数据集中合并估计的问题

我一直在尝试对我使用 mice() 来估算缺失数据的数据框运行零膨胀泊松回归。我的代码成功地运行了多重插补并汇集了结果......

回答 0 投票 0

如何在 R 中使用 MICE 包进行多重插补后使用 rowSums()

我有一个简短的问题: 我使用 MICE 包的多重插补来插补项目数据。 插补后,我想将项目加总到总分。 但是,我的数据现在在一个 mids 对象中......

回答 1 投票 0

使用 MICE 包,如何从变量列表创建模型列表以使用 glm 进行测试

我想做t检验(或chi^2检验)来估计grou=0和grou=1之间变量的差异。数据集中的所有变量均由 MICE 估算。变量包括 AGE、SCORE、GENDER、HEART、e...

回答 2 投票 0

约束归因

我实际上有两个原始数据集(每个数据集都以特定方式与每个数据集相关,但知道具体如何并不重要),但是这两个数据集包含一些 outl...

回答 0 投票 0

sklearn.impute.SimpleImputer:无法填写数据框列列表的最常见值

我有一个数据框的列列表,其中包含 NA(如下)。所有这些列的 dtype 都是 str。 X_train_objects = ['HomePlanet', '目的地', '姓名', '机舱信', 'Cabin_num ...

回答 1 投票 0

将R中选定列中的所有NA替换为FALSE

我有一个与此类似的问题,但我的数据集有点大:50 列,其中 1 列为 UID,其他列携带 TRUE 或 NA,我想将所有 NA 更改为 FALSE,但我没有...

回答 6 投票 0

连续数据,BayesianRidge 的 IterativeImputer 的 cross_val_score() binary|multiclass 不支持 Y 响应

问题定义,持续挑战 这个新的 imputer_bayesian_ridge() 函数用于 Iterative Imputer 来插补训练数据。送入data frame训练数据,立马得到data.val...

回答 1 投票 0

如何在 mice 之后使用 with() 中的 CreateTableOne() 来获得汇总结果?

我想使用 CreateTableOne() 来计算 Mice 估算后两组(grou=0 和 grou=1)之间变量的 SMD(标准化均值差)。但是我发现CreateTableOne()不能...

回答 1 投票 0

使用 MICE 包,如何从变量列表创建模型列表以使用 glm 进行测试

我想做t检验(或chi^2检验)来估计grou=0和grou=1之间变量的差异。数据集中的所有变量均由 MICE 估算。变量包括 AGE、SCORE、GENDER、HEART、e...

回答 1 投票 0

如何从变量列表创建模型列表以使用 glm 进行测试

我想做t检验(或chi^2检验)来估计grou=0和grou=1之间变量的差异。数据集中的所有变量均由 MICE 估算。变量包括 AGE、SCORE、GENDER、HEART、e...

回答 1 投票 0

R

我有这样的数据集 结构(列表(年龄 = c(20、21、30、NA、NA、NA、50、61、60、63, NA, NA, NA), 性别 = c(NA, 0, NA, 1, NA, 1, 0, NA, NA, NA, NA, 0, 1), 糖尿病 = c(NA, NA, 1, 1, NA, 1, NA,...

回答 2 投票 0

Python Impute using BayesianRidge() sklearn impute.IterativeImputer 回归估算分析值误差

问题 使用 sklearn.impute.IterativeImputer 中的 interativeImputer,以获得适合 BayesianRidge() 的回归模型,用于估算变量“Frontage”中的缺失数据。 在 interative_imputer_...之后

回答 0 投票 0

使用第二个索引级别的最后一个可用值来估算多索引数据框中的缺失值

我正在努力解决以下问题: 我有以下结构的时间序列数据的多级索引数据框: 将熊猫导入为 pd 将 numpy 导入为 np multi_index = pd.MultiIndex.from_...

回答 1 投票 0

只在特定的数值中执行

我有一个数据框,我需要根据其他样本来推算一个值。该列是数字的,并意味着行业数字,fx(1111 - IT,1234 - 金融,等等)。我试图应用...

回答 1 投票 0

使用XGBClassifier后,如何保存已填充的缺失数据?

我有一个数据集,里面有缺失的值,但是这对XGBClassifier来说不是问题。它可以为您动态地填充值。我想保存XGBClassifier填充的特征。我的...

回答 1 投票 0

使用XGBClassifier后,如何保存已填充的缺失数据?

我有一个数据集,里面有缺失的值,但是这对XGBClassifier来说不是问题。它可以为您动态地填充值。我想保存XGBClassifier填充的特征。我的...

回答 1 投票 0

只在特定的数值中执行

我有一个数据框,我需要根据其他样本来推算一个值。该列是数字的,并意味着行业数字,fx(1111 - IT,1234 - 金融,等等)。我试图应用...

回答 1 投票 0

我在sklearn的IterativeImputer输出中得到负值。

我正在使用sklearn库中的Multiple Imputer来推算雨量数据集中的一些缺失值,其中包含雨量站和雨量数据(每个雨量站为一列,索引为DateTime)......

回答 1 投票 -1

阿梅利亚相关分析

我想从Amelia包中的原始数据集 "freetrade "中的推算数据集进行相关性分析。所以首先我加载了数据,并使用amelia函数创建了多个数据集:......

回答 1 投票 1

从多个数据帧中获取和保存结果

我有九个不同的数据帧 df1, df2, df3, df4, df5, df6, df7, df8和df9. 我想写一个函数,应用下面的计算,使用小鼠包的每个数据帧......。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.