missing-data 相关问题

有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。

缺少适用于pandas数据框列的函数

我正在尝试将一个函数应用于“年龄”和“区域”列,以获取我在“所需”列中显示的结果。不幸的是,这种功能给我带来了错误。我知道还有其他...

回答 1 投票 0

如何填充一列中与另一列相关的缺失值?

我的数据集具有标记为“城市”,“邮政编码”,“邻居”的列。我具有“邻居”的所有值,但缺少城市和邮政编码的某些值。如何匹配“邻居” ...

回答 1 投票 0

MySQL计算空值

我正在尝试计算变量的特定结果。它是区域数据,我那里有缺失,我相信在尝试计算比率时会被忽略。选择日期计数(当区域位于...

回答 1 投票 0

如何处理线性回归中的缺失值?

我有一个包含60个变量的数据框,并且所有变量都缺少值,以至于没有一行是完整的:complete.cases(data)[1]否否否否否否否否否......>] >

回答 1 投票 0

缺少10的数据缺少填充NAN

df = pd.DataFrame({'From_To':['LoNDon_paris','MAdrid_miLAN','londON_StockhOlm','Budapest_PaRis','Brussels_londOn'],'FlightNumber':[10045,np.nan,10065,np。 nan,10085],'RecentDelays':[[23,47] ...

回答 1 投票 0

是否要删除数据框中数据缺失的行?

我正在尝试在rodham :: emails中随时间(emails $ docDate)绘制电子邮件主题(emails $ subject)中定义的术语(x)的频率。问题是无论如何我都得到相同的情节...

回答 1 投票 0

用于查找一系列列表是否不包含特定值的SQL代码

我在一家制造公司工作。我们有一个位于Microsoft SQL环境中的ERP系统。我们的商店是所谓的高品种,低产量制造商。我们本质上是一个自定义...

回答 2 投票 0

将NA值替换为另一列的和

我正在尝试用另一列中的值之和替换所有不适用的NA值,但我有些困惑。数据的外观df#Distance Distance2#1 160 8#2 ...

回答 2 投票 1

缺少函数中的条件熊猫

我想要一个函数,如果area列缺少值(如SQL中的NULL),则目标'wand'变量中的结果为'A'。我对使用None,isnull(),...

回答 2 投票 0

根据R中另一个变量的两年值创建一个变量

看起来很简单,但我无法在线找到答案。我拥有1995-2015年间具有城市特征的面板数据。对于某些变量,我只有2000年和2010年的数据。...

回答 2 投票 0

当国家/地区没有数据时,高地图会在点击时获得国家/地区名称

我有一张世界地图,并显示了某些国家/地区的数据。获取这些国家/地区的点击处理程序很简单。 (另请参见在点击事件时高图获取国家/地区名称)但是,我会...

回答 1 投票 0

当我在R ggplot2中绘制缺失的日期时,如何使用中断整数来调整X轴的比例

当我有很多数据显示缺失的日期时,如何以整数为单位调整刻度轴X的间隔。我正在使用的代码是下一个(@Stefan帮助我):#SET OF DATA df

回答 1 投票 1

如何使用ggplot2绘制时间序列数据中的缺失日期?

我有一个温度序列的时间序列数据(平均值,最大值,最小值),缺少日期,并且折线图没有继续,此图在水平线之前一直跳到下一个日期。我会...

回答 2 投票 0

我该如何使用ggplot2绘制时间序列数据中的缺失日期?

有人可以帮助我解决下一个问题:我有温度的时间序列数据(平均值,最大值,最小值),缺少日期,并且折线图没有继续,此图的跳跃是带有...

回答 1 投票 0

在SQL中删除重复项和几乎重复项(缺少值)

我需要一种删除重复行的方法,该方法还可以删除等同但有一些缺失值的行。即我的身份证号码是第一年的城市国家1 John SMITH 1985纽约,美国1 ...

回答 1 投票 0

如何在R中的数据集中找到缺失值的位置? [重复]

是否有任何功能可以指示R中缺失值的位置?

回答 2 投票 -3

用内插函数在熊猫数据框中填充NaN

我发现一行包含我的数据框中的两个缺失数据。数据WeatherHR0 6.4 WeatherHR1 6 WeatherHR2 5.8 WeatherHR3 5.4 WeatherHR4 NaN WeatherHR5 NaN WeatherHR6 4.7 ...

回答 1 投票 0

我将删除58000+行中的行。如果超过5%的变量为NA,则删除行[重复]

我的数据框有58000+行和26列。我将删除58000+行的行。如果超过5%的变量为NA,则删除行。

回答 1 投票 0

pandas的插值函数对我不起作用

我发现一行包含我的数据框中的两个缺失数据。数据WeatherHR0 6.4 WeatherHR1 6 WeatherHR2 5.8 WeatherHR3 5.4 WeatherHR4 NaN WeatherHR5 NaN WeatherHR6 4.7 ...

回答 1 投票 0

如果行包含的NA大于%5,则从数据框中删除行

我有很多行。而且每一列都有NA。如果行包含的NA不超过%5,我想从数据帧中删除行。您能帮我吗!怎么做?

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.