有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。
我想用不同/唯一的ID(例如,如果我有以下DF + ---- + ------ + | ID | T_Id | + ---- + ------ + | 1 | nan | | 1 | nan | | 1 | nan | | 1 | 4 | | 1 | ...
我具有与ID编号相关联的项目第1部分,第2部分,第3部分,第4部分和第5部分的列表,如下所示:ID |项目-| ---- 1 |第1部分1 |第2部分1 |第3部分1 |第4部分2 |第1部分2 | ...
为了最好地决定如何处理天气数据集中每个要素的缺失数据,我想获取每个要素和每个气象站的NaN最长块的长度,后者……
我有时间序列数据,其值表示自上次接收信号以来的时间(以毫秒为单位)。类似于这样的时间:时间(ms)750758755738738718> 2204727702695697697701 In ...
[在RStudio中,我有以下代码:install(ggplot2)install(dplyr)数据为* gapminder_data.csv * * str(gapminder_data.csv)*'data.frame':1704个观察值。 6个变量中的1个:$国家:具有142个水平的因子...
[在RStudio中,我有以下代码:install(ggplot2)install(dplyr)数据为* gapminder_data.csv * * str(gapminder_data.csv)*'data.frame':1704个观察值。 6个变量中的1个:$国家:具有142个水平的因子...
我已使用lmlist将公用项应用于分组数据(由参与者),并使用每个参与者的系数(A)创建一个数据框,例如:myCoefficients
让我们说我有以下熊猫数据框:+ --------------------- + --------- + ----- -+ ----- + | seen_cats_count |年|一个月天+ --------------------- + --------- + ------- + ----- + | ...
我有一个包含10多个分类变量和大约20个数字变量的数据集。我正在尝试编辑Stef van Buuren在github上可用的mice.impute.logreg函数,以调用glm.fit(),但是...
在R中使用Hmisc处理缺失值后如何处理'Impute'数据类型
[我使用Hmisc程序包来估算缺少的值,并在将数据框替换回原来的值后,我注意到我的变量类型已更改为某些许多计算机算法都无法识别的“估算”类型...
所以这是我的问题:我有2010年至2019年的每日利率原始数据。但是,缺少几个日期。 1244 9-Jul-10 5.053 1245 8-Jul 10 5.007 1246 7-Jul 10 ...
如何根据其他列满足的条件来填充缺失值,例如我想仅基于“产品类别”列填充基于“产品类别”列的产品容器列的仔细值]
我有一个数据集,其中包含大约12个类别变量,级别范围为2-10,以及其他数字变量。约280条记录。我在r中使用mouses包对...
缺少响应变量时无法运行MixedModel。我收到错误消息:KeyError:找不到缺少的密钥以前,Julia可以没有问题地运行它。我使用CSV.read加载数据,但是...
我有一个大数据集,其中包含多个列中的许多NaN值。我尝试了以下代码,但它没有从数据集中删除Nan值df = pd.read_excel('sec3_data.xlsx')df ....
将缺失观测值的变量添加到现有大熊猫df中,而不会丢失较大df中的观测值
我有两个数据框。一个称为ENFORE的139个观测值:引用Enfore 0170/0952 1 0175/0686 1 0184/0521 1 0183/0726 1 0178/0595 0另一个称为CITATIONS的数据帧具有...
我有一个如下数据框:df = pd.DataFrame({'one':pd.Series(['a','b','c','d','aa','bb',np .nan,'b','c',np.nan,np.nan]),'two':pd.Series([10,20,30,40,50,60,10,20,30,40, 50])})在...
WT列的丢失数据被编码为-99。我想用WT的上一个和下一个值的平均值替换丢失的值。例如,缺少的值是在时间= 2和时间= 3时我想要...
我希望得到一些帮助来识别:当不存在NA值时(缺少整行)缺少观测值的位置。为缺失的数据创建一行,并基于平均值...
我为数据集估算了缺失值的均值,但是通过此过程,我可以看到数量值以科学格式显示,尽管数据类型仍为float64。我用过...