imputation 相关问题

缺少数据插补是用替换的“最佳猜测”值替换缺失数据的过程。由于缺失数据可能会产生分析数据的问题并可能导致数据丢失,因此估算是一种避免与列表删除相关的问题的方法(忽略所有缺失值的观察结果)。

调查表格。我想根据[关闭]

第一个标签,我创建调查表。我希望根据selectbox中的数据打开不同的选项。我该怎么办?从...

回答 1 投票 -1

R中的Amelia归因排除未收到项目的参与者

首次发布,希望有所帮助。我正在尝试使用amelia通过单个期望最大化估算来估算数据。但是,我的样本中有两个小组,其中一些小组...

回答 1 投票 1

在R中,可以从相应的代码中插入字符串,反之亦然吗?

我有一个具有代码字符串对的数据集。换句话说,有一列代码和对应的一列字符串是这些代码的描述。问题是三个-...

回答 1 投票 0

R中带有分类变量的MICE归类疑难解答

我一直在尝试对来自Kaggle的数据进行MICE实验,但是在归类类别变量时遇到了麻烦。我正在研究此笔记本-https://www.kaggle.com/rtatman / ...

回答 1 投票 0

仅在值范围内运算

我有一个数据框,需要在其中基于其他样本来估算一个值。该列为数字,表示行业编号fx(1111-IT,1234-Finance,依此类推)。我试图申请...

回答 1 投票 0

如何确定缺失值是MAR,MCAR还是MNAR

我有一个庞大的蛋白质组学数据集。在行中我有蛋白质,在行中我有样品。数据集包含很多缺失值。我想知道我是否可以找出...

回答 1 投票 0

对于大的缺失,插补与对随机森林的可用子集进行训练相比有什么优势?

我想在缺失较大的数据集上训练随机森林模型。我知道“标准方法”,即我们在训练集中估算缺少的数据,对...

回答 1 投票 1

来自其他列sql的条件的不重复记录ID

想象一下我有这个数据集:serial_id |名称| address_id | id_duplicates | dob _______________________________________________________ 1 |约翰| QWERTY | NULL | 10/2001 2 ...

回答 1 投票 0

Sklearn的SimpleImputer在管道中时无法检索插补值

在尝试使用SimpleImputer后,我会打印出所有插补值。单独使用SimpleImputer时,我可以从实例的statistics_属性中检索它们。这有效...

回答 1 投票 1

Scikit学习如何将缺少数据的分类值更改为数字值

我正在将sklearn用于机器学习项目,其中一列是分类形式。我想使用序数编码器将其转换为数字形式,然后估算缺少的...

回答 1 投票 -1

在R中按天序列输入缺少的天数

我在使用R的数据框中输入缺失的观测值时遇到问题,下面是该数据帧的快照:数据帧的样本实际上我有66个不同的区域(21天……)>] >> < [

回答 2 投票 -1

missForest不会估算我的分类变量

我不是一个经验丰富的编码人员,过去几周刚开始学习R,可以帮助完成与我的博士学位相关的一些工作。这是问题所在:我已经尝试了很多小时都失败了...

回答 1 投票 0

在分组的数据框中插入缺失值

我是在分组数据框中插入缺失值。在DF内部,将缺失值随机分配给Var1和Var2。该数据帧按变量Factory:MachineNum分组。归因为...

回答 1 投票 0

如何使用mlr3估算数据并使用NA值进行预测?

我遵循mlr3的文档,有关使用管道进行数据插入。但是,如果只有一列不适用,我所训练的模式不允许进行预测。您是否知道为什么...

回答 1 投票 1

为什么XGBRegressor预测功能不匹配警告?

我想使用XGBRegressor预测一些数据。因此,我加载了训练数据和测试数据。 iowa_file_path ='../input/train.csv'test_data_path ='../input/test.csv'data = pd.read_csv(...

回答 1 投票 1

如何用丢失的前后值的平均值填充向量中的丢失的值

当前,我试图在R中的向量中估算值。估算的条件是。查找所有NA值,然后检查它们之前和之后是否存在现有值。还要检查...

回答 1 投票 0

Python中用于Google Analytics(分析)数据的数据插补

我有一个网站上的Google Analytics(分析)数据集,我打算对该项目进行分析。但是,由于维护和其他因素,有很多日期没有数据。我想要...

回答 1 投票 1

无法使用R汇总小鼠中的平均值:对象类数字的无视方法

[我正在尝试使用R中的mouses软件包估算连续变量的平均值。我能够生成m个估算的平均值,但是当我尝试使用pool()函数汇总这些平均值时,会得到一个...

回答 1 投票 0

python中的二进制值

我有一个缺少值的数据框,其中可能的选项为True或False,因为在有NaN种情况下,pandas将列作为浮点,并在推算该列和...之后]]

回答 2 投票 -3

LabelEncoder在估算缺少的值后无法进行逆变换(看不见的标签)

我处于初级到中级数据科学水平。我想使用knn从数据框中估算缺少的值。由于数据框包含字符串和浮点数,因此我需要使用...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.