有关缺失数据问题的问题,可能涉及特殊数据结构,算法,统计方法,建模技术,可视化以及其他考虑因素。
我正在尝试将一个函数应用于“年龄”和“区域”列,以获取我在“所需”列中显示的结果。不幸的是,这种功能给我带来了错误。我知道还有其他...
我的数据集具有标记为“城市”,“邮政编码”,“邻居”的列。我具有“邻居”的所有值,但缺少城市和邮政编码的某些值。如何匹配“邻居” ...
我正在尝试计算变量的特定结果。它是区域数据,我那里有缺失,我相信在尝试计算比率时会被忽略。选择日期计数(当区域位于...
我有一个包含60个变量的数据框,并且所有变量都缺少值,以至于没有一行是完整的:complete.cases(data)[1]否否否否否否否否否......>] >
df = pd.DataFrame({'From_To':['LoNDon_paris','MAdrid_miLAN','londON_StockhOlm','Budapest_PaRis','Brussels_londOn'],'FlightNumber':[10045,np.nan,10065,np。 nan,10085],'RecentDelays':[[23,47] ...
我正在尝试在rodham :: emails中随时间(emails $ docDate)绘制电子邮件主题(emails $ subject)中定义的术语(x)的频率。问题是无论如何我都得到相同的情节...
我在一家制造公司工作。我们有一个位于Microsoft SQL环境中的ERP系统。我们的商店是所谓的高品种,低产量制造商。我们本质上是一个自定义...
我正在尝试用另一列中的值之和替换所有不适用的NA值,但我有些困惑。数据的外观df#Distance Distance2#1 160 8#2 ...
我想要一个函数,如果area列缺少值(如SQL中的NULL),则目标'wand'变量中的结果为'A'。我对使用None,isnull(),...
看起来很简单,但我无法在线找到答案。我拥有1995-2015年间具有城市特征的面板数据。对于某些变量,我只有2000年和2010年的数据。...
我有一张世界地图,并显示了某些国家/地区的数据。获取这些国家/地区的点击处理程序很简单。 (另请参见在点击事件时高图获取国家/地区名称)但是,我会...
当我在R ggplot2中绘制缺失的日期时,如何使用中断整数来调整X轴的比例
当我有很多数据显示缺失的日期时,如何以整数为单位调整刻度轴X的间隔。我正在使用的代码是下一个(@Stefan帮助我):#SET OF DATA df
我有一个温度序列的时间序列数据(平均值,最大值,最小值),缺少日期,并且折线图没有继续,此图在水平线之前一直跳到下一个日期。我会...
有人可以帮助我解决下一个问题:我有温度的时间序列数据(平均值,最大值,最小值),缺少日期,并且折线图没有继续,此图的跳跃是带有...
我需要一种删除重复行的方法,该方法还可以删除等同但有一些缺失值的行。即我的身份证号码是第一年的城市国家1 John SMITH 1985纽约,美国1 ...
我发现一行包含我的数据框中的两个缺失数据。数据WeatherHR0 6.4 WeatherHR1 6 WeatherHR2 5.8 WeatherHR3 5.4 WeatherHR4 NaN WeatherHR5 NaN WeatherHR6 4.7 ...
我将删除58000+行中的行。如果超过5%的变量为NA,则删除行[重复]
我的数据框有58000+行和26列。我将删除58000+行的行。如果超过5%的变量为NA,则删除行。
我发现一行包含我的数据框中的两个缺失数据。数据WeatherHR0 6.4 WeatherHR1 6 WeatherHR2 5.8 WeatherHR3 5.4 WeatherHR4 NaN WeatherHR5 NaN WeatherHR6 4.7 ...
我有很多行。而且每一列都有NA。如果行包含的NA不超过%5,我想从数据帧中删除行。您能帮我吗!怎么做?