cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

脱字符平均预测值

我想使用R中的插入符号来获得CV重复的平均预测值。require(“插入符号”)data(“ iris”)fitControl

回答 1 投票 0

R中的分层k倍交叉验证

假设我有一个多类数据集(例如,iris)。我要执行分层的10折CV以测试模型性能。我在包splitstackchange中找到了一个名为stratified的函数,该函数是...

回答 1 投票 0

在简单的一维数据集上,LogisticRegressionCV选择了可怕的超参数,所得分数没有意义

我正在尝试使用LogisticRegressionCV将Logistic回归模型拟合到简单的1D数据集。非常奇怪的是,当给出选择时,似乎选择了一个很小的C值,这迫使我的模型选择一个...

回答 1 投票 1

使用scikit-learn进行SVR的递归特征消除和网格搜索

我正在使用SVR解决预测问题,我想进行特征选择以及超参数搜索。我正在尝试同时使用RFECV和GridSearchCV,但是从我的...

回答 1 投票 0

具有R中单个隐藏层大小变化的交叉验证多个神经网络

我必须使用交叉验证来找出模型的单个隐藏层应包含的神经元数量(使用nnet包)。我必须在R中编写一个函数,该函数接受数据,模型和...

回答 1 投票 1

R中的Xgboost进行训练和预测

当在r中使用包xgboost和函数xgb.cv时,我有一个与模型的交叉验证,调整,训练和预测有关的问题。特别是,我已经重复使用和改编了...

回答 1 投票 1

如何从普通的机器学习技术转变为交叉验证?

从sklearn.svm导入sklearn.feature_extraction.text的LinearSVC从sklearn.feature_extraction.text导入CountVectorizer从sklearn.metrics导入TfidfTransformer导入precision_score ...

回答 1 投票 0

为什么我不能在bestglm的输出上使用cv.glm?

我试图在葡萄酒数据集上进行最佳子集选择,然后我想使用10倍CV得出测试错误率。我使用的代码是-cost1 ...

回答 1 投票 1

用于特征选择预处理的交叉验证的动机是什么?

我看了几篇文章和有关特征选择(包装器和嵌入式方法)的示例,在这些文章中,他们将样本数据分为训练集和测试集。我了解为什么我们需要使用交叉验证(...

回答 1 投票 0

使用GroupKFold在使用sklearn的嵌套交叉验证中

我的代码基于sklearn网站上的示例:https://scikit-learn.org/stable/auto_examples/model_selection/plot_nested_cross_validation_iris.html我正在尝试在内部使用GroupKFold ...

回答 1 投票 0

如何获得交叉验证中的keras scikit-learn包装器的训练和验证损失

我知道keras中的model.fit返回一个callbacks.History对象,我们可以从中获取损失和其他指标,如下所示。 ... train_history = model.fit(X_train,Y_train,...

回答 1 投票 1

从kfold,fit,score和使用cross_val_score获得分数之间有什么区别?

[这似乎很基本,但是我看不到以下两种方式之间的区别和优缺点:第一种方式:kf = KFold(n_splits = 2)for train_index,kf.split(X)中的test_index:.. 。

回答 1 投票 1



过采样:SMOTE参数'ratio'

jupyter笔记本使我出错:init()得到了一个意外的关键字参数'ratio',我的代码:smote = SMOTE(ratio ='minority',random_state = 10)也尝试:smote = SMOTE(ratio = 0.5,.. 。

回答 1 投票 0

为什么我的cross_val_score()精度很高,但是我的测试精度很低?

使用KerasWrapper时,我获得了很高的训练精度:X_train,X_test,y_train,y_test = train_test_split(train_data,train_labels,shuffle = True,test_size = 0.3,random_state = 42)高于95%...

回答 1 投票 -1

如何仅对30%的数据使用RandomizedSearchCV或GridSearchCV

如何仅对30%的数据使用RandomizedSearchCV或GridSearchCV,以加快处理速度。我的X.shape是94456,100,我正在尝试使用RandomizedSearchCV或GridSearchCV,但是它使用的是...

回答 2 投票 0

Python spyder +张量流交叉验证在Windows 10上冻结

在Windows 10上,我已经安装了Anaconda并启动了Spyder。我还成功安装了Theano,Tensorflow和Keras,因为当我执行import keras时,控制台输出使用...

回答 2 投票 0

如何为交叉验证的param_distributions和fit_params选择最佳值以适合模型?

我正在实现LightGBM分类器(LGBMClassifier),其超参数由RandomizedSearchCV交叉验证(sklearn库)选择。我对...

回答 2 投票 -1

带有游标程序包的fit_resamples失败

尝试使用交叉折叠重采样并从Ranger软件包中拟合随机森林。没有重新采样的拟合效果很好,但是一旦我尝试重新采样拟合,它就会失败并出现以下错误。考虑以下df df ]

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.