missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

在 R 中的几列中按组(年和月)计数 NA 值

我想计算该系列中每个月和年的缺失值 (NA) 数量,并绘制几列的条形图。 如何从数据框中提取这些信息? <- read.

回答 1 投票 0

按组(年份和日期)计算 R 中多个列中的 NA 值

我想计算该系列中每个月和年的缺失值 (NA) 数量,并绘制几列的条形图。 如何从数据框中提取这些信息? <- read.

回答 1 投票 0

在 VS Code 中导入库时出现问题

我尝试在本地 VS 代码中运行一些脚本,但我不断收到此错误“无法解析导入“pyjson5””。这个也出现在所有其他库中,

回答 1 投票 0

使用库 mouse() 中的估算数据集来拟合 R 中的多级模型

我是在 R 中打包小鼠的新手。但我试图从 popmis 中估算 5 个数据集,然后用每个数据集拟合一个 lmer() 模型,最后用 pool() 拟合它们。 我认为 mouse() 中的 pool() 函数不会...

回答 2 投票 0

如何在 gnuplot 中制作缺失数据的连续线

我有一些数据缺少条目,这些条目被替换为?,这是一个片段: 20 0.8793 2.14765 1.57448 0.808 1.08829 0.86717 21 0.88832 2.23218 1.57538 0.92825 1.20609 22 1.8370...

回答 1 投票 0

用另一个数据集中的数据替换 NA 值

我有这个数据集,这是一个例子: df1 州年 ColA ColB ColC 俄亥俄州 2000 200 190 180 俄亥俄州 2002 218 200 176 俄亥俄州 2010 218 205 185 肯塔基州 2000 2...

回答 1 投票 0

线程“主”java.lang.UnsatisfiedLinkError中出现异常:无法加载库:/usr/lib/jvm/java-17-openjdk-amd64/lib/libawt_xawt.so

只想加载 .jar 文件,但我不能,当运行 java --version 时,我得到: openjdk 17.0.4 2022-07-19, OpenJDK 运行时环境(内部版本 17.0.4+8-Debian-1),以及 OpenJDK 64 位服务器虚拟机(构建...

回答 2 投票 0

SQL 脚本返回重复行

我有一个脚本,我需要从不同的表返回很多值,但是在排列某些表时我不断收到重复的行,并且我也无法链接其他表。 我想要重新...

回答 1 投票 0

Weka 工具中列的平均值

如何应用列的平均值来删除数据集中的缺失值。 我想使用“列平均值”替换数据集中的缺失值,它将用

回答 1 投票 0

用 NN 进行插值,数据中留下 NaN

我尝试使用最近邻从数据集中输入值,它对几乎所有 NaN 都做到了这一点,但它错过了两个。 我正在研究泰坦尼克号数据集,我正在尝试估算 m 的年龄......

回答 1 投票 0

使用 SQL 创建日期列,组合年月日列,其中少数年月日为 NULL

我有年、月、日三列。不幸的是,很少有年、月或日为 NULL。如何创建一个日期列,组合这三列,其中年、月和日不是......

回答 1 投票 0

使用同一行中的先前值填充 R 矩阵中的缺失值

考虑以下示例 之前 = 矩阵(c(1, 2, 3, NA, 4, 5, NA, NA, 1), ncol = 3) 之后 = 矩阵(c(1, 2, 3, 1, 4, 5, 1, 4, 1), ncol = 3) 之前的矩阵是我经常处理的矩阵

回答 2 投票 0

Power BI DAX:根据行值对不同列求和

我有两个表:A 和 B。A 有一列 [cat]。 B 有 3 列:[cat]、[amount] 和 [fringe]。 A[cat] 有 3 个值:“Fringe”、“Salary”和“Other”。 B[猫]只有h...

回答 1 投票 0

将 NA 值随机分配给数据框中的列

我正在尝试将 NA 值分配给一列。 数据: df <- data.frame(V1 = c(0, 0, 0, 1, 0, 1, 1, 1, 1, 0), V2 = c(0, 0, 0, 1, 1, 1, 1, 1, 1, 0), V3 = c(0, 1, 1, 0, 0, 0, 1, 1...

回答 1 投票 0

如何填写 Polars 数据框中缺失的日期(python)?

我似乎没有找到 Polars 库的等效项。但基本上,我想要做的是填充大数据框的两个日期之间缺失的日期。由于尺寸的原因,它必须是 Polars

回答 2 投票 0

是否有一个简化的 SQL 查询来返回表中缺失值的数量和百分比? (BigQuery)

BigQuery 地震公共数据集有 47 列,其中大部分都有缺失值。我需要一个输出,显示包含 column_name、total_entries、non_missing_entries 和 Percentage_miss 的摘要...

回答 1 投票 0

制作缺少年份的动画

我正在尝试使用 gganimate 随着时间的推移对位置进行动画处理,并拥有一个从 2004 年到 2022 年运行的数据集。不幸的是,我没有 2020 年的数据(由于新冠疫情)。当我尝试使用 gganimate 时,2020 年显示...

回答 1 投票 0

前向填充nan和零

假设我有一个数据框 df1,其中包含零和 nan: 日期 = pd.date_range('20170101',期间=20) df1 = pd.DataFrame(np.random.randint(10,size=(20,3)),index=dates,columns=['foo','bar','see']...

回答 2 投票 0

为什么数组的最后一个元素丢失了?

我已经在C中定义了一个数组。我想实现一个代码,我可以在数组中间插入一个新值(数组内除了第一个和最后一个位置之外的任何位置)。所以我写了...

回答 1 投票 0

lme4 样本量与完整案例数据集之间存在差异?

我目前正在使用 lme4 估计分层线性模型(HLM)。我的整个数据集有 367 个观察值。 lme4 使用 341 个观测值估计了我的模型 - 我假设一些观测值由于 mi 而被丢弃...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.