有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。
我想移动多指数数据框架中的一列,以便计算一个具有滞后独立变量的回归模型。由于我的时间序列有缺失的值,我只想把前一天的值 ...
我想完成我的时间序列的湿度%,缺少记录(或行)。传感器被设计为记录一个平均值,每15分钟,所以这是我的目标频率。这里的一个例子,一个站(...
上图是我目前正在处理的数据的一部分,fips列中的一些数据丢失了。我正试图使用其他列的信息来替换缺失的值 ...
我正在处理一个数据科学问题,我遇到了这个问题。我有一个标记的数据(训练数据)和非标记的数据(测试数据),他们都有很多缺失的数据。我与...
我有一个从2008年到2020年的随机日期数据及其对应的数值 Date Val 2012年9月16日 32 2014年9月19日 33 2008年1月05日 26 6月07日, ...
如何将该组的平均数填入非整数,并将所有NaN组的平均数改为0。
这是我的数据集:姓名,花费,收到 A,1012,1200 A,?,1500 B,1300,? B,2000,2500 B,?,? C,?,? C,?,? 数据集有? 可以是任何非整数值,如na或? A,B,C行的花费值为?
我已经用那段代码对观察到的数据点之间的数据进行了线性插值:df2 % group_by(iso3)%>% mutate_at(vars(annc4), list(inter = ~na.approx(., na.rm = FALSE)))%& ...
有什么办法可以根据另一列的值来替换缺失的值,使之与列名相匹配?
我有一个数据集:a day day.1.time day.2.time day.3.time day.4.time day.5.time 1 NA 2 4 5 7 10 4 2 NA 5 4 1 1 ...
我有一个pandas DataFrame是这样的:year = [2015, 2016, 2009, 2000, 1998, 2017, 1980, 2016, 2015, 2015] mode = ["automatic", "automatic", "manual", "manual", np.nan,'automatic', np.nan, 'automatic', ...。
我有一组数据存储在txt文件中,如下。海拔(道路)间隔1.3 1 3.3 2 4.1 3 -1.5 4 NA... ...
那么我的数据是这样的:年份,y,x1,x2,x3,x4 2009,0.5,0.4,0.4,0.9 2013,nan,0.4,0.5,0.8 2020,0.8,0.39,0.51,0.7 数据是以年为单位的,但是每一年之间的时间间隔并不一致......。
这里是原始数据:新数据;输入id a b c;牌; 1 41。 。 1。 42。 1。 。 43;跑;我如何获得这样的输出? id a b c 1 41 42 43
我正在尝试将单元格值从StudyID列拉到空单元格SigmaID列,但是我在输出中遇到了一个奇怪的问题。这是运行命令之前数据的外观。 ...
为什么我无法根据另一列中的值替换数据框中一列中的这些NA值? [Python]
我有一个包含两列的数据框(df3):SUBSCRIBE和Weeks3Meals。订阅是一个分类变量,可以接受值(Y,N),而Weeks3Meals的类型为float。两者都包含缺失值(NaN)...
最近,我一直在用数据集中的一些变量进行卡方检验。问题是某些变量的缺失值被列为-9而不是NA,我尝试使用一些策略来...
使用R中另一个变量的线性回归的斜率对单个变量的缺失数据进行处理
这里是我的数据集(df8)的摘录,其中包含194个国家/地区从2000年到2018年的时间序列。 iso3年anc4中位数 1 BIH 2000 ...
Python statsmodels中缺少观测值和聚类标准错误吗?
仅对不丢失的数据运行回归并使用聚类的标准错误的最干净,最Python方式是什么?想象一下,我有一个熊猫数据框all_data。有效的笨拙方法(创建一个...
从(稀疏)JSON获取可预测的Pandas DataFrame
我正在从API获取JSON。该API省略了空值(不通过网络发送为空的属性),因此可以稀疏数据。这些属性包含字符串,数字,布尔值,...
[我需要在熊猫中插入数字列示例数据:Age Time_of_service 42 4 24 5 nan 27 26 4 31 5 54 21 21 2 Nan 32 45 18 ...