有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。
是否有可能从数个模型中提取出适合乘以推算数据的汇总估计值?下面是我如何为完整的案例数据框执行此操作(即没有丢失数据) - ...
我试图通过这个程序将十进制转换为二进制,但输出始终缺少最后一位数。例如,我将输入“123”作为商,结果将是“111101”而不是“...
我正在尝试使用来自panda的read_csv在Python中读取空格分隔文件。它的工作原理是指定delimiter =“”。当列中存在某些缺失值时会出现问题,因为它...
我已经问了一个类似的问题(见这里),但不幸的是它还不够清楚,所以我决定用一个更好的数据集创建一个新的例子和一个新的解释...
为了处理缺失的数据,我编写了以下模型并运行它。输出如下。为什么训练采用NaN期望值,由loss_0_where_nan(以及......)掩盖
现在我面临一个我无法解决的问题,让我解释一下。我需要转动一个spark-dataframe,但在某些情况下,没有转轴的记录来包含我需要的列。这是 ...
我想为具有主目标和辅助目标的数据集构建Keras模型。我有数据集中所有条目的辅助目标数据,但对于主目标,我只有数据...
您如何找到应该(可预测地)存在于数据帧中但不存在的条目?我可能微不足道的问题类似于这个问题,但是还有一两层 - 每一个解决方案我......
通过从pandas数据帧中的非缺失值中随机选择来填充缺失数据
我有一个pandas数据框,其中有几个缺失值。我注意到非缺失值彼此接近。因此,我想通过随机选择来估算缺失值...
我正在尝试为没有缺失值的数据集运行分类算法。这是数据集描述:'data.frame':59977 obs。 6个变量:$性别:因子w / 2 ...
我有从csv制作的数据帧,其中缺少的数据由?表示?符号。我想检查一下有多少行?发生次数。到目前为止,我做了这个,但它显示...
我想编写一些代码来检查列中是否包含NA值,以及如果它优于某个值,那么该列将从另一个选项卡中删除。我有这个......
我想为netcdf文件中的4和8字节浮点变量设计一个“填充”值,以表示丢失数据的特殊情况。已经有一个恒定的NF_FILL_FLOAT和我的理解......
是否有任何包可用于多重插补?或者我可以用来编写自己的函数的任何引用?由于缺少数据的百分比在某些数据列中确实很高(...
我目前有数据集:Time Var1 Var2 Cat 1 14 16 1 2 16 98 1 4 52 68 1 7 17 12 1 1 57 58 2 3 45 35 2 4 33 12 2 7 77 1 2并希望......
Python如何使用bfill方法填充自定义值(例如“#NA ####”)?
我有一个包含“#NA ####”的数据框。我想用组均值来回填这个值。我知道我可以先用np.NAN替换“#NA ####”,然后使用pd.fillna,但还有更方便的方法吗?
好的,所以我有这个data.frame:A B C 1黄紫色 2 黄色3橙黄色 4橙色 棕色5 ...
数据集具有时间和温度值。还给出了开始和结束日期。 start_date = '22 -02-2018 10:35:29'end_date = '23 -02-2018 10:34:29'TIMESTAMP Temp1 Temp2 22-02-2018 14:......