missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

在多索引数据框中移动列时,会出现日期错误。

我想移动多指数数据框架中的一列,以便计算一个具有滞后独立变量的回归模型。由于我的时间序列有缺失的值,我只想把前一天的值 ...

回答 1 投票 0

重新索引为缺失的值提供值,而不是NaN。

我想完成我的时间序列的湿度%,缺少记录(或行)。传感器被设计为记录一个平均值,每15分钟,所以这是我的目标频率。这里的一个例子,一个站(...

回答 1 投票 2

如何替换数据中的缺失值?

上图是我目前正在处理的数据的一部分,fips列中的一些数据丢失了。我正试图使用其他列的信息来替换缺失的值 ...

回答 2 投票 0

周精度与测试数据

我正在处理一个数据科学问题,我遇到了这个问题。我有一个标记的数据(训练数据)和非标记的数据(测试数据),他们都有很多缺失的数据。我与...

回答 1 投票 0

在时间序列数据中添加缺失的日期[重复]

我有一个从2008年到2020年的随机日期数据及其对应的数值 Date Val 2012年9月16日 32 2014年9月19日 33 2008年1月05日 26 6月07日, ...

回答 1 投票 -1

如何将该组的平均数填入非整数,并将所有NaN组的平均数改为0。

这是我的数据集:姓名,花费,收到 A,1012,1200 A,?,1500 B,1300,? B,2000,2500 B,?,? C,?,? C,?,? 数据集有? 可以是任何非整数值,如na或? A,B,C行的花费值为?

回答 1 投票 -1

在R中对一个单一变量和多个国家使用线性回归法估算缺失数据

我已经用那段代码对观察到的数据点之间的数据进行了线性插值:df2 % group_by(iso3)%>% mutate_at(vars(annc4), list(inter = ~na.approx(., na.rm = FALSE)))%& ...

回答 1 投票 0

有什么办法可以根据另一列的值来替换缺失的值,使之与列名相匹配?

我有一个数据集:a day day.1.time day.2.time day.3.time day.4.time day.5.time 1 NA 2 4 5 7 10 4 2 NA 5 4 1 1 ...

回答 1 投票 0

如何用条件来填充缺失的值?

我有一个pandas DataFrame是这样的:year = [2015, 2016, 2009, 2000, 1998, 2017, 1980, 2016, 2015, 2015] mode = ["automatic", "automatic", "manual", "manual", np.nan,'automatic', np.nan, 'automatic', ...。

回答 1 投票 1

如何用python处理丢失的数据

我有一组数据存储在txt文件中,如下。海拔(道路)间隔1.3 1 3.3 2 4.1 3 -1.5 4 NA... ...

回答 3 投票 2

使用给定的特征集在python中输入时间序列数据。

那么我的数据是这样的:年份,y,x1,x2,x3,x4 2009,0.5,0.4,0.4,0.9 2013,nan,0.4,0.5,0.8 2020,0.8,0.39,0.51,0.7 数据是以年为单位的,但是每一年之间的时间间隔并不一致......。

回答 1 投票 0


sas--交易缺少值?

这里是原始数据:新数据;输入id a b c;牌; 1 41。 。 1。 42。 1。 。 43;跑;我如何获得这样的输出? id a b c 1 41 42 43

回答 1 投票 0

用R中另一列中的值替换一列中的空单元格

我正在尝试将单元格值从StudyID列拉到空单元格SigmaID列,但是我在输出中遇到了一个奇怪的问题。这是运行命令之前数据的外观。 ...

回答 1 投票 0

为什么我无法根据另一列中的值替换数据框中一列中的这些NA值? [Python]

我有一个包含两列的数据框(df3):SUBSCRIBE和Weeks3Meals。订阅是一个分类变量,可以接受值(Y,N),而Weeks3Meals的类型为float。两者都包含缺失值(NaN)...

回答 1 投票 0

Nanair包裹没有预期的结果

最近,我一直在用数据集中的一些变量进行卡方检验。问题是某些变量的缺失值被列为-9而不是NA,我尝试使用一些策略来...

回答 1 投票 0

使用R中另一个变量的线性回归的斜率对单个变量的缺失数据进行处理

这里是我的数据集(df8)的摘录,其中包含194个国家/地区从2000年到2018年的时间序列。 iso3年anc4中位数 1 BIH 2000 ...

回答 1 投票 0

Python statsmodels中缺少观测值和聚类标准错误吗?

仅对不丢失的数据运行回归并使用聚类的标准错误的最干净,最Python方式是什么?想象一下,我有一个熊猫数据框all_data。有效的笨拙方法(创建一个...

回答 1 投票 1

从(稀疏)JSON获取可预测的Pandas DataFrame

我正在从API获取JSON。该API省略了空值(不通过网络发送为空的属性),因此可以稀疏数据。这些属性包含字符串,数字,布尔值,...

回答 1 投票 0

如何基于另一列填充熊猫中的数字缺失值

[我需要在熊猫中插入数字列示例数据:Age Time_of_service 42 4 24 5 nan 27 26 4 31 5 54 21 21 2 Nan 32 45 18 ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.