cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

为什么我的cross_val_score()精度很高,但是我的测试精度很低?

使用KerasWrapper时,我获得了很高的训练精度:X_train,X_test,y_train,y_test = train_test_split(train_data,train_labels,shuffle = True,test_size = 0.3,random_state = 42)高于95%...

回答 1 投票 -1

如何仅对30%的数据使用RandomizedSearchCV或GridSearchCV

如何仅对30%的数据使用RandomizedSearchCV或GridSearchCV,以加快处理速度。我的X.shape是94456,100,我正在尝试使用RandomizedSearchCV或GridSearchCV,但是它使用的是...

回答 2 投票 0

Python spyder +张量流交叉验证在Windows 10上冻结

在Windows 10上,我已经安装了Anaconda并启动了Spyder。我还成功安装了Theano,Tensorflow和Keras,因为当我执行import keras时,控制台输出使用...

回答 2 投票 0

如何为交叉验证的param_distributions和fit_params选择最佳值以适合模型?

我正在实现LightGBM分类器(LGBMClassifier),其超参数由RandomizedSearchCV交叉验证(sklearn库)选择。我对...

回答 2 投票 -1

带有游标程序包的fit_resamples失败

尝试使用交叉折叠重采样并从Ranger软件包中拟合随机森林。没有重新采样的拟合效果很好,但是一旦我尝试重新采样拟合,它就会失败并出现以下错误。考虑以下df df ]

回答 2 投票 0

如何使用交叉验证计算RMSE时如何舍入y

[当我在sklearn中使用交叉验证时,它将返回我一个RMSE值。 RMSE值由预测y值(例如7.11)的均方根-实际y值(例如6)的均方根计算得出...

回答 1 投票 0

应该对原始数据还是拆分数据执行交叉验证分数?

[当我想通过交叉验证评估模型时,我应该对原始数据(在训练和测试中未拆分的数据)还是在训练/测试数据上进行交叉验证?我知道训练数据是...

回答 2 投票 0

如何为多类别计算具有多个分数的交叉验证?

我正在用python开始我的第一个机器学习代码。但是,在为多类模型计算召回率,精度和f1时遇到错误。 X = pd.read_excel(path,dtype = int)allarray = ...

回答 2 投票 0

KFold交叉验证不能解决过度拟合问题

我将X和y中的特征分开,然后在用k倍交叉验证将其分割后对火车测试数据进行预处理。之后,我将火车数据拟合到我的随机森林回归模型,然后...

回答 2 投票 1

检查过度拟合

我想确保我的模型没有过拟合。我使用交叉验证检查了过度拟合。所有折痕的结果均接近。但同时我检查了火车并测试了预测。 ...

回答 1 投票 0

谁能帮助我根据时间条件将我的时间序列数据集分为训练和测试?

将数据分为两个数据集:训练数据集和测试数据集。训练数据集应包括前7,111个观察值(直到2004年的最后一个观察值)。目的是使用...

回答 1 投票 1

交叉验证和改进

我想知道交叉验证过程如何改善模型。我是这个领域的新手,热衷于学习。我了解交叉验证的原理,但不了解交叉验证的原理...

回答 2 投票 0

当对诸如BERT的语言模型进行微调时,进行交叉验证是否有意义?

我有一个关于微调BERT等语言模型的问题。由于我只有一个大小约为5k的数据集,因此进行交叉验证是否有意义?我没有找到有关此主题的任何线索。 ...

回答 1 投票 1

简化K形交叉验证,收到此错误TypeError:如果未指定任何评分,则传递的估计量应具有“评分”方法

我有这段代码可以构建模型并对其进行训练。 model = Sequential()model.add(Convolution2D(32,kernel_size =(3,3),padding ='same',input_shape = input_shape))model.add(Activation('...

回答 1 投票 0

一方面,在SFlarn中,KFlold与带有shuffle = True的KFold之间存在差异,而在sklearn中,KFold与RepeatedKFold之间存在差异

我正在使用sklearn版本0.22比较KFlold和RepeatedKFold。根据文档:RepeatedKFold“在每个重复中以不同的随机性重复N次K-fold”。一个会...

回答 1 投票 2

PCA在交叉验证中;但是,仅包含变量的子集

此问题与插入符的交叉验证中的预处理非常相似;但是,在我正在从事的项目中,我只希望对我的案例中的19个中的三个预测变量进行PCA。这是...

回答 1 投票 0

一方面,在Sklearn中,KFlold与带有shuffle = True的KFold之间存在差异,而在sklearn中,KFold与RepeatedKFold之间存在差异

我正在使用sklearn版本0.22比较KFlold和RepeatedKFold。根据文档:RepeatedKFold“在每个重复中以不同的随机性重复N次K-fold”。一个会...

回答 1 投票 2

如何在scikit中学习cross_validate的自定义评分指标?

我想将pr_auc开发为cross_validate()的评分指标。因此,我遵循了Scikit Learn的用户指南:https://scikit-learn.org/stable/modules/model_evaluation.html#scoring显示了我的代码...

回答 1 投票 1

ValueError:参数(条件)的参数值必须是序列(而不是字符串)或np.ndarray

因此,我尝试调整模型的参数,但出现此错误(请参见下文),但找不到解决方法?最佳参数:{'条件':'熵','min_samples_split':5}最佳得分:...

回答 1 投票 0


© www.soinside.com 2019 - 2024. All rights reserved.