missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

pandas backfil和填充不同的值

我想用不同/唯一的ID(例如,如果我有以下DF + ---- + ------ + | ID | T_Id | + ---- + ------ + | 1 | nan | | 1 | nan | | 1 | nan | | 1 | 4 | | 1 | ...

回答 3 投票 1

对于具有相同ID列表值的每条记录不在其他列中

我具有与ID编号相关联的项目第1部分,第2部分,第3部分,第4部分和第5部分的列表,如下所示:ID |项目-| ---- 1 |第1部分1 |第2部分1 |第3部分1 |第4部分2 |第1部分2 | ...

回答 1 投票 0

GroupBy到数据帧的优雅映射

为了最好地决定如何处理天气数据集中每个要素的缺失数据,我想获取每个要素和每个气象站的NaN最长块的长度,后者……

回答 1 投票 0

重建丢失的数据

我有时间序列数据,其值表示自上次接收信号以来的时间(以毫秒为单位)。类似于这样的时间:时间(ms)750758755738738718> 2204727702695697697701 In ...

回答 1 投票 0

汇总不同的列后表中缺少日期

[在RStudio中,我有以下代码:install(ggplot2)install(dplyr)数据为* gapminder_data.csv * * str(gapminder_data.csv)*'data.frame':1704个观察值。 6个变量中的1个:$国家:具有142个水平的因子...

回答 1 投票 0

汇总不同的列后表中缺少日期

[在RStudio中,我有以下代码:install(ggplot2)install(dplyr)数据为* gapminder_data.csv * * str(gapminder_data.csv)*'data.frame':1704个观察值。 6个变量中的1个:$国家:具有142个水平的因子...

回答 2 投票 0

如何在已删除缺失数据的地方添加空行

我已使用lmlist将公用项应用于分组数据(由参与者),并使用每个参与者的系数(A)创建一个数据框,例如:myCoefficients

回答 3 投票 0

在大熊猫数据框中的时间间隔内填写缺失的观测值

让我们说我有以下熊猫数据框:+ --------------------- + --------- + ----- -+ ----- + | seen_cats_count |年|一个月天+ --------------------- + --------- + ------- + ----- + | ...

回答 1 投票 0

r:sym()函数失败[无法将字符串转换为符号]

我有一个包含10多个分类变量和大约20个数字变量的数据集。我正在尝试编辑Stef van Buuren在github上可用的mice.impute.logreg函数,以调用glm.fit(),但是...

回答 1 投票 0

在R中使用Hmisc处理缺失值后如何处理'Impute'数据类型

[我使用Hmisc程序包来估算缺少的值,并在将数据框替换回原来的值后,我注意到我的变量类型已更改为某些许多计算机算法都无法识别的“估算”类型...

回答 1 投票 0

原始数据中的缺失值

所以这是我的问题:我有2010年至2019年的每日利率原始数据。但是,缺少几个日期。 1244 9-Jul-10 5.053 1245 8-Jul 10 5.007 1246 7-Jul 10 ...

回答 1 投票 1

在熊猫中填充空值

如何根据其他列满足的条件来填充缺失值,例如我想仅基于“产品类别”列填充基于“产品类别”列的产品容器列的仔细值]

回答 1 投票 0

小鼠:glm.fit:算法未收敛

我有一个数据集,其中包含大约12个类别变量,级别范围为2-10,以及其他数字变量。约280条记录。我在r中使用mouses包对...

回答 1 投票 1

Julia中缺少值的混合模型

缺少响应变量时无法运行MixedModel。我收到错误消息:KeyError:找不到缺少的密钥以前,Julia可以没有问题地运行它。我使用CSV.read加载数据,但是...

回答 1 投票 0

如何在Python中处理数据中的NaN值?

我有一个大数据集,其中包含多个列中的许多NaN值。我尝试了以下代码,但它没有从数据集中删除Nan值df = pd.read_excel('sec3_data.xlsx')df ....

回答 3 投票 0

将缺失观测值的变量添加到现有大熊猫df中,而不会丢失较大df中的观测值

我有两个数据框。一个称为ENFORE的139个观测值:引用Enfore 0170/0952 1 0175/0686 1 0184/0521 1 0183/0726 1 0178/0595 0另一个称为CITATIONS的数据帧具有...

回答 1 投票 1

如何根据其他变量估算缺失值

我有一个如下数据框:df = pd.DataFrame({'one':pd.Series(['a','b','c','d','aa','bb',np .nan,'b','c',np.nan,np.nan]),'two':pd.Series([10,20,30,40,50,60,10,20,30,40, 50])})在...

回答 1 投票 0

根据记录前后的平均值添加缺失的数据

WT列的丢失数据被编码为-99。我想用WT的上一个和下一个值的平均值替换丢失的值。例如,缺少的值是在时间= 2和时间= 3时我想要...

回答 1 投票 0

用均值查找和填充缺失的观测值(整行不是NA值)

我希望得到一些帮助来识别:当不存在NA值时(缺少整行)缺少观测值的位置。为缺失的数据创建一行,并基于平均值...

回答 2 投票 0

在数据框中以均值估算缺失值后,科学计数法中出现的数字

我为数据集估算了缺失值的均值,但是通过此过程,我可以看到数量值以科学格式显示,尽管数据类型仍为float64。我用过...

回答 2 投票 0

最新问题
© www.soinside.com 2019 - 2024. All rights reserved.