missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

在 R- 零膨胀泊松中使用 MICE 从多个估算数据集中合并估计的问题

我一直在尝试对我使用 mice() 来估算缺失数据的数据框运行零膨胀泊松回归。我的代码成功地运行了多重插补并汇集了结果......

回答 0 投票 0

read.csv:某些列在 R 中设置为零(应该是数字但作为字符导入)

我正在尝试导入一些带有字段数据的 csv 文件,以将多个 csv 文件合并为一个。 我的目标是只有数字列。 不幸的是,R 将所有值替换为“0”...

回答 0 投票 0

直角三角形的第三个三维坐标

对于 3D 空间中的直角三角形,如果我有 斜边开始和结束 3D 坐标 3D平面定义 已知两侧的长度(斜边除外) 我怎样才能计算出第三个 3D

回答 2 投票 0

ImportError:无法从“sklearn.neighbors._base”导入名称“_check_weights”

我正在尝试将 Missforest 作为处理表数据中缺失值的方法。 导入sklearn 打印(sklearn.__version__) ->1.2.1 导入 sklearn.neighbors._base 导入系统 sys.modules['skle...

回答 0 投票 0

插值函数不填充数据框中的 nan 值

晚上好,我在填充数据框中缺失的数据时遇到了问题。 如果缺失值的数量是 betw...

回答 1 投票 0

将R中选定列中的所有NA替换为FALSE

我有一个与此类似的问题,但我的数据集有点大:50 列,其中 1 列为 UID,其他列携带 TRUE 或 NA,我想将所有 NA 更改为 FALSE,但我没有...

回答 6 投票 0

str.format() 引发 KeyError

以下代码引发 KeyError 异常: addr_list_formatted = [] 地址列表 IDX = 0 for addr in addr_list: # addr_list 是一个列表 addr_list_idx = addr_list_idx + 1 addr_list_formatted.

回答 2 投票 0

any(df.isnull()) 和 pd.isnull(data).any() 的不同结果

我正在使用带有 pandas 的标准波士顿房屋数据框,我注意到一些让我烦恼的事情: 当我以两种不同的方式检查缺失值时——我得到了两种不同的结果,t...

回答 1 投票 0

沿行填充缺失值

我是一个绝对的 R 初学者所以请耐心等待我解释!我正在寻找一个代码,该代码将通过使用最后一个可用性来填充最右列 (edu2019) 中的 NA 值...

回答 2 投票 0

时间变量缺失值,SPSS

我对记录为字符串的时间变量(编码为 hmm 或 hhmm)有疑问。我需要以下方面的帮助: 值 9999 必须编码为缺失,NA。 值h99或hh99,需要编码为h...

回答 0 投票 0

使用第二个索引级别的最后一个可用值来估算多索引数据框中的缺失值

我正在努力解决以下问题: 我有以下结构的时间序列数据的多级索引数据框: 将熊猫导入为 pd 将 numpy 导入为 np multi_index = pd.MultiIndex.from_...

回答 1 投票 0

鉴别组内缺失值是否等于平均值

我有一个数据集如下。# dt 年份 ST CC ID M NonMissing Tot GRP_Mean 2004 55 35 60 NA 3 4 174.0000 2005 55 35 60 174 3 4 174.0000 ...。

回答 1 投票 0

在R中执行PCA与许多NA的关系。

我有一个大型数据集,包含10个变量和12,000个观测值,来自3种不同的系统(200个来自小池塘,600个来自河流,11200个来自湖泊)。在我的数据中,有很多新农合...

回答 1 投票 0

使用XGBClassifier后,如何保存已填充的缺失数据?

我有一个数据集,里面有缺失的值,但是这对XGBClassifier来说不是问题。它可以为您动态地填充值。我想保存XGBClassifier填充的特征。我的...

回答 1 投票 0

使用XGBClassifier后,如何保存已填充的缺失数据?

我有一个数据集,里面有缺失的值,但是这对XGBClassifier来说不是问题。它可以为您动态地填充值。我想保存XGBClassifier填充的特征。我的...

回答 1 投票 0

dropna()在给定阈值的情况下,对axis = 1不起作用[重复] 。

对于给定的数据集,我执行了一个dropna的轴=1与阈值=2 df.dropna(thresh=2,axis=1) 输出是 这似乎并不正确,我期望的是下降列与索引=1 ... ...

回答 1 投票 0

为什么mutate()命令会创建NAs?

我目前正在研究一个亚马逊的数据集,有很多行,这使得很难发现数据中的问题。我的目标是看amazon数据,看某些产品是否有较高 ...

回答 1 投票 0

R中按组别分列的缺失值数量

我有一个数据框架,其中有几个缺失值(NAs),在一列名为Group的数据中被分成若干组(A,B,C,D,E,F)。我试图用R分析它,我想用表格计算行数......

回答 1 投票 0

在df中添加列。`$<-.data.frame中出错:替换后有x行,数据有153行。

当我试图在回归的数据框架中添加一列时,我收到一个错误: df.

回答 1 投票 0

这种表结构有什么比较便宜的方法可以找到缺失的记录?

我有一个主数据流表,格式类似于下面的流表。每个idtype都有一组可能的idname。我试图找出哪个id有缺失的idname。我还创建了...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.