outliers 相关问题

异常值是一种观察结果,与数据集的简单表征相比,似乎不常见或没有很好地描述。

没有异常值的 Matplotlib 箱线图

在 matplotlib (python) 中绘制箱线图时有什么方法可以隐藏异常值吗? 我正在使用最简单的方法来绘制它: 从 pylab 导入 * 箱线图([1,2,3,4,5,10]) 展示() 这个...

回答 1 投票 0

替换 data.frame 列中的某些值

我有一个数据如下: 数据<-data.frame(id=c(1,2,3,4,5,6,7,8,9,10), Wt=c(91,92,85,205,285,43,95,75,76,NA), Ht=c(185,182,173,171,600,650,NA,890,NA,NA)) Wt

回答 2 投票 0

在Python中删除异常值并计算具有不同实际值数量的多列的修剪平均值

我有一个数据集。假设有 10010 行和 100 列,列值可能包含 NaN,并且每一列的 NaN 可以不同。 具有不同行数和 3 列的示例数据集...

回答 1 投票 0

通过仅显示胡须并隐藏异常值来放大Python中的绘图箱线图

我在我的streamlit应用程序中绘制了以下箱线图:` 图 = px.box(df, x=x_column, y=y_column, color=x_column) st.plotly_chart(图,use_container_width=True) 我还没找到

回答 2 投票 0

当数据框中存在大约 1/3 的缺失值时,如何标记所有异常值?

假设有一个包含 10000 个样本和 4 个特征的数据框,并且不保证特征是独立的 np.随机.种子(42) 数据 = np.random.randn(10000, 4) df = pd.DataFrame(数据, 列...

回答 1 投票 0

为什么用 np.nan 替换异常值会删除该列中的所有非零数据?

我正在尝试用 .nan 值(而不是整个列)替换异常值,以便我可以用中位数填充所有 .nan 值。到目前为止我已经尝试了两种方法: 将 numpy 导入为 np 进口熊猫...

回答 1 投票 0

用中位数替换离群值时,为什么会出现“ValueError:列的长度必须与键相同”

我尝试在数据帧上运行此循环以消除异常值并将其替换为中位数,但我遇到了这个问题:“ValueError:列必须与键长度相同”。 这……

回答 0 投票 0

如何删除异常值或对我的回归模型具有高杠杆作用的特定数据点?

我使用 ols_plot_resid_lev() 创建了这个图,并且看到了异常值和杠杆点,我想删除它们以改进我的回归模型。我的数据集有 5 个变量,全部有 140 个 bi...

回答 1 投票 0

R - 通过干预分析和预测更快地检测时间序列中的异常值

我有大约 3000 个时间序列的医疗数据(来自医疗预约的诊断),想用 tsoutliers 包中的 tso 函数进行干预分析,然后进行预测

回答 0 投票 0

如何从数据集列表中删除异常值

我正在尝试从两个数据集的列表中删除异常值: #创建数据集 repr = 列表(mtcars,空气质量) #detectig 箱线图 g_stats = lapply(repr, function(x) boxplot(x, main = "Boxplot...

回答 1 投票 0

处理线性回归模型中数值变量中大量的 0 值

对此有点陌生,但这里有 我有一个车辆故障数据集,我想使用一些线性回归模型来预测故障率 目标变量是 Vehicle FAIL % 14独立连续

回答 0 投票 0

处理异常值

我正在对 UCI“成人数据集”进行一些数据分析。我有一个称为“每周小时数”的数字特征和另一个称为“年龄”的特征。这些是唯一的数字......

回答 0 投票 0

错误:替换有62行,数据有1044

我正在尝试在具有 6 个变量的 1044 个观测值的数据集上运行 cooks.distance(以删除异常值)。 我首先尝试在包含 Cook's Dis 的数据集中创建一个新变量...

回答 0 投票 0

时间序列数据的异常值检测

我有一个 pandas 数据框,我想在其中检测单个列上的异常值。请记住,我在数据处理/清理方面没有经验。 你可以在下图中看到...

回答 2 投票 0

从 PHP 中的对象数组中删除异常值

我的数据看起来像这样...... 我试图找出从数据中删除所有异常值的最佳方法。数据会随着搜索的不同而变化,所以我给它 20% 的比例很重要

回答 0 投票 0

数据框的异常值上限

我有一个带有“tot_dl_vol”列的数据框。我想限制年同比百分比高于 80% 或低于 10% 的该列的值。我如何实现这一目标?我...

回答 1 投票 0

时间序列异常值求解器

所以,我想制作具有异常值效应的 ARIMA。然后我已经完成了异常值的检测。但是,当我想对其建模时,我的输出中出现错误 #输入数据 dt<-read_exc...

回答 0 投票 0

ggplot 散点绘图点不响应颜色参数

我做了一个循环来创建差异(y 轴)与样本(x 轴)的散点图列表。对于这些图,异常值被定义为样本,其中两个计数之间的差异对于相同的 sam...

回答 1 投票 0

为每个箱线图提取和打印异常值

我制作了箱线图来识别每年每一列的异常值。我想提取并打印异常值。 这是我的代码: `# 显示每年的异常值或极值 分组 =

回答 0 投票 0

如何在具有反射测量模型或分割的 SEM 中找到异常值?我为此使用比例值吗?

如果我想在一个(多个)方程的路径分析中找到异常值并简单地使用比例值,我可以使用以下函数: 注册.fit.dv1 <- lm(data= df, XX ~ AB + CD + DE)

回答 0 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.