cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

在Caret交叉验证随机森林方法中的mtry

我有一个包含499个观测值和1412个变量的数据框。我将我的数据框分成火车和测试集,并尝试使用随机森林方法在Caret 5折交叉验证中设置的火车。我......

回答 1 投票 1

在插入符号包中使用train函数时的线性回归误差

我有一个名为value的数据集,它有四个变量(ER是因变量)和400个观察值(删除N / A后)。我试图将数据集划分为训练和测试集并训练......

回答 1 投票 0

如何在XGBooost中使用early_stopping_rounds参数

我正在使用XGBoost在Datacamp Extreme Gradient Boosting上执行一个教程,我对一个结果有点困惑。执行以下代码时#创建您的住房DMatrix:housing_dmatrix = ...

回答 1 投票 -1

xgBoost [Rank:Pairwise]:交叉验证不能按预期工作(它会启动运行时错误)

操作系统:MacOSX 10.12.4编译器:gcc5使用的包(python / R / jvm / C ++):Python'xgboost'版本使用:0.6(昨天从'pip install'下载)Python版本= 2.7.13步骤...

回答 1 投票 0

R:cv.glm变量长度不同错误

我试图比较后向选择与线性回归的尺寸减少。数据集相当大,有150个变量。我总是使用相同的方法来生成与...的比较

回答 1 投票 0

在Python中将单个列拆分为多个子列/数组

我正在尝试用Python实现决策树算法来预测丢失的输入数据。假设我有一个包含99个条目的列。在这99个条目中,有20个是NaN。我想分手这个......

回答 1 投票 1

KFolds交叉验证与train_test_split

我今天刚建立了我的第一个随机森林分类器,我正在努力提高它的性能。我正在阅读有关交叉验证如何避免过度拟合数据的重要性,从而获得......

回答 2 投票 2

获取GridSearchCV的标准偏差

在scikit-learn 0.20之前,我们可以使用result.grid_scores_ [result.best_index_]来获得标准偏差。 (它返回例证:平均值:0.76172,标准:0.05225,参数:{'n_neighbors':21})什么是......

回答 1 投票 3

如何从交叉验证中产生混淆矩阵?

我是R和机器学习的新手,我正在使用2个类的数据。我正在尝试进行交叉验证,但是当我尝试制作模型的混淆矩阵时,我得到一个错误,所有参数都必须...

回答 2 投票 1

libsvm中的Holdout与K折叠交叉验证

我正在使用libsvm进行分类任务。我有10倍交叉验证,其中F1得分为0.80。但是,当我将训练数据集分成两部分时(一部分用于培训,另一部分用于...

回答 2 投票 1

使用Cross_Val_score的原因

我对使用cross_val_score的原因感到困惑。根据我的理解,cross_val_score告诉我的模型是“过度拟合”还是“过度拟合”。而且,它不训练我的模型。既然我有......

回答 1 投票 0

RepeatedKFold实际上意味着什么?

假设n_repeats = 5且折叠数为3(n_splits = 3)。这是否意味着验证器为我们的估算器/模型创建了3倍以使用每个折叠(就像KFold的用途),然后重复...

回答 1 投票 3

如何使用CrossValidator在不同的模型之间进行选择

我知道我可以使用CrossValidator来调整单个模型。但是,对于相互评估不同模型的建议方法是什么?例如,说我想评估一个......

回答 1 投票 2

安装scikit在ubuntu上学习

我试图使用cross_val_predict函数来获得使用scikit-learn制作的二元分类器的准确性。我使用的命令是:从sklearn.model_selection import cross_val_predict ...

回答 1 投票 0

使用sklearn获得精度和召回

使用下面的代码,我有准确性。现在我试图1)找到每个折叠的精度和召回率(总共10倍)2)得到精度的平均值3)得到回忆的平均值这可能...

回答 1 投票 0

如何在CV-ing数据集中实现基于比率的SMOTE过采样

我正在处理关于二元分类问题的非常不平衡的数据集(~5%)。我正在使用SMOTE和一个随机森林分类器来使我的过采样在GridSearch CV循环中发生(如...

回答 1 投票 1

如果不使用spark-ml中的管道,交叉验证会更快吗?

假设我的功能工程中有很多步骤:我的管道中会有很多变换器。我想知道Spark在管道的交叉验证过程中如何处理这些变压器:...

回答 1 投票 1

添加了Standardscaler但在交叉验证和相关矩阵中收到错误

这是我为应用多元线性回归而构建的代码。我添加了标准缩放器来修复Y截距p值,这个值并不显着,但CV RMSE的结果到底有什么问题......

回答 1 投票 0

为什么我在python中的sklearn中使用管道获取不同的值而没有管道

我正在使用递归特征消除与交叉验证(rfecv)与GridSearchCV与RandomForest分类器如下使用管道和不使用管道。我的管道代码是......

回答 1 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.