cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

如何在带有朴素贝叶斯分类器和NLTK的scikit中使用k-fold交叉验证

我有一个小语料库,我想用10倍交叉验证来计算朴素贝叶斯分类器的准确性,怎么做呢。

回答 5 投票 28

早期停止与Keras和sklearn GridSearchCV交叉验证

我希望用Keras和sklean的GridSearchCV实现早期停止。下面的工作代码示例修改自如何使用Python中的深度学习模型的网格搜索超参数...

回答 4 投票 13

在h2o中留出一次交叉验证

我想检查我在h2o中的非常小的df的留一交叉验证的结果。这是我的输入df:https://drive.google.com/file/d/1UiIkxlHCq1tJZNOH6hQD30gEMaPdmhgh/view?usp=sharing是...

回答 1 投票 1

列车测试分裂的缺点

“火车/测试拆分确实存在危险 - 如果我们的拆分不是随机的怎么办?如果我们的数据的一部分只有来自某个州的人员,具有一定收入水平但没有...的员工怎么办?

回答 2 投票 1

无法在多标签分类器上使用Stratified-K-Fold

下面的代码用于进行KFold验证,但是我要训练模型,因为它抛出错误ValueError:检查目标时出错:期望dense_14有形状(7,)但得到数组......

回答 1 投票 0

sklearn分层k-fold CV与线性模型如ElasticNetCV

使用sklearn交叉验证(CV)非常简单直接。但是在线性CV模型中设置cv = 5时的默认实现,如ElasticNetCV或LassoCV是KFold CV。为......

回答 1 投票 0

TypeError:级别类型不匹配:0.2。将数据拆分为训练,验证和测试集合时

美好的一天,我试图训练,验证和测试数据,而不使用scikit-learn。我希望将数据分成以下样本:训练数据0.7(70%)验证数据0.2(20%)...

回答 2 投票 0

交叉验证/培训验证在PySpark中使用多个管道进行拆分

我正在尝试评估PySpark中的多个管道。我可以在一个单独的CV / TVS中为每个人做,但我想只用一个,所以它直接给我最好的模型,我找不到...

回答 1 投票 0

为什么cross_val_predict不适合测量泛化误差?

当我使用交叉验证训练SVC时,y_pred = cross_val_predict(svc,X,y,cv = 5,method ='predict')cross_val_predict为X中的每个元素返回一个类预测,以便y_pred.shape =(...

回答 1 投票 3

WEKA的交叉验证和SMOTE

我正在尝试使用带有SMOTE的FilteredClassifier在WEKA上运行5倍交叉验证。据我所知,我应该在每个CV折叠中应用SMOTE以获得我的CV错误。有没有人......

回答 1 投票 1

ngrams文本模型与交叉验证

在ngram模型(字符ngram或词袋)中,我们需要确保测试数据的词汇不用于拟合或训练模型。这就是sklearn TfidfVectorizer的功能......

回答 1 投票 0

如何在Tensorflow中分割LSTM的训练数据和测试数据以进行时间序列预测

我最近从https://github.com/Hvass-Labs/TensorFlow-Tutorials/blob/master/23_Time-Series-Prediction.ipynb学习LSTM的时间序列预测。在他的教程中,他说:而不是训练......

回答 2 投票 1

嵌套交叉验证:cross_validate如何处理GridSearchCV作为其输入估算器?

以下代码将cross_validate与GridSearchCV结合使用,以对虹膜数据集上的SVC执行嵌套交叉验证。 (以下文档页面的修改示例:https:// scikit -...

回答 1 投票 2

如何显示每个交叉验证折叠的混淆矩阵和报告(调用,精度,fmeasure)

我试图在python中执行10倍交叉验证。我知道如何计算混淆矩阵和分裂测试报告(例如分开80%训练和20%测试)。但问题是我......

回答 1 投票 0

TypeError:__ init __()得到了一个意外的关键字参数'cv'

我想将SVM与LeaveOneOut交叉验证(Loocv)一起使用。代码如下:从sklearn.svm导入SVC从sklearn.model_selection导入LeaveOneOut,train_test_split导入numpy为np ...

回答 1 投票 0

Stratified Shuffle Split ValueError:y中填充最少的类只有1个成员,这个成员太少了

我正在努力让我的分层洗牌分开工作。我有两组数据,功能和标签,我正在尝试返回名为results的列表,其中应该包含所有准确性的列表/ ...

回答 1 投票 0

R中的时间序列交叉验证:使用tsCV()和tsm() - 模型

我目前正在尝试使用时间序列交叉验证来评估tslm模型。我想使用一个固定的模型(没有参数重新估计),看看前面1到3步的地平线预测......

回答 2 投票 1

交叉验证中的数据扩充

我是否正确理解对象分类任务中的数据扩充应该只在训练集上完成?如果是这样,您如何使用增强数据实现10倍交叉验证? ...

回答 2 投票 0

我在哪里可以找到在R中使用mlr包的完整示例

我正在研究mlr包,R。但是我能找到的所有教程都集中在每个函数的使用上。我希望我能找到一个全面的例子,包括建模的所有步骤。 ...

回答 1 投票 0

Azure Machine Learning Studio表示跨验证模块的“必需值”

我在MS Machine Learning Studio中设置这个交叉验证模块时遇到了一些麻烦。我不确定它指的是哪个值需要,因为连接到它的链接很好,并且......

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.