cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

对于cross_val_score和.score,回归评分结果显着不同

我正在运行RandomForestRegressor()。我正在使用R平方进行得分。为什么我使用.score与cross_val_score得到截然不同的结果?以下是相关代码:X = df.drop(['y_var'],...

回答 1 投票 1

python中的KFold到底做了什么?

我正在看这个教程:https://www.dataquest.io/mission/74/getting-started-with-kaggle我得到第9部分,做出预测。在那里有一些名为titanic的数据框中的数据,这是......

回答 2 投票 7

Scikit-learn:在GridSearchCV中得分

看来,scikit-learn的GridSearchCV会收集其(内部)交叉验证折叠的分数,然后对所有折叠的分数进行平均。我想知道这背后的理由。 ...

回答 1 投票 2

SKLEARN导入cross_validation的问题

我正在尝试使用机器学习,但我遇到了sklearn和导入cross_validation的问题。我一直收到错误消息说ImportError:无法导入名称'...

回答 1 投票 -2

艰难的交叉验证

我正在Keras中实现一个多层感知器并使用scikit-learn来执行交叉验证。为此,我受到了来自sklearn的Keras交叉验证问题中的代码的启发....

回答 3 投票 8

scikit中的交叉验证指标 - 了解每个数据拆分

请,我只需要为(X_test,y_test)数据的每次拆分明确地获得交叉验证统计信息。所以,为了尝试这样做,我做了:kf = KFold(n_splits = n_splits)X_train_tmp = [] ...

回答 1 投票 1

如何在scikit-learn中正确执行交叉验证?

我正在尝试对k-nn分类器进行交叉验证,我对以下两种方法中的哪一种正确进行交叉验证感到困惑。 training_scores = defaultdict(list)...

回答 2 投票 2

如何在sklearn中实现前进测试?

在sklearn中,GridSearchCV可以将管道作为参数,通过交叉验证找到最佳估算器。但是,通常的交叉验证是这样的:交叉验证时间序列数据,......

回答 3 投票 22

通过替换sklearn.cross_validation从sklearn.model_selection导入StratifiedShuffleSplit时参数应该进行哪些更改

我试图运行一个用于隔离语音识别的python3代码,在那里我得到了一个使用的DeprecationWarning:来自sklearn.cross_validation import StratifiedShuffleSplit为了删除这个......

回答 1 投票 1

关于使用R的KNN的k折叠交叉验证的问题

我试图对k的几个值进行5倍交叉验证。我在ISLR包中使用了OJ数据集。我的代码到目前为止,库(ISLR)库(类)ks = c(1:5)err.rate.test

回答 1 投票 0

Cross_val_score不能与roc_auc和多类一起使用

我想做什么:我希望在多类问题上使用roc_auc计算cross_val_score我尝试做的事情:这是一个用虹膜数据集制作的可重现的例子。来自sklearn.datasets ...

回答 1 投票 1

LightGBM中的交叉验证

在阅读了LightGBM关于交叉验证的文档后,我希望这个社区能够阐明交叉验证结果并改进我们使用LightGBM的预测。我们怎么样 ...

回答 3 投票 10

使用Matlab perfcurve在交叉验证中绘制ROC曲线

我有以下代码用于使用SVM进行二进制分类,以及10个交叉验证,更新:找到解决方案,请参阅下面的注释k = 10; cp = classperf(lables); cvFolds = crossvalind('Kfold',......

回答 1 投票 0

在python中实现k-cross验证

我试图在测试矩阵上不使用库来实现k-cross验证背后的逻辑。某些方面,我的旋转矩阵工作不正常。我把k取为5. X = np.matrix([[...

回答 1 投票 0

在PCR函数R PLS包中使用预定义拆分

为了确保良好的人口代表性,我从我的训练数据中创建了自定义验证集。但是,我不确定我是如何在R中进行PCR接口的,我试图添加一个列表...

回答 1 投票 0

正常回归和生存回归的预测极限

我试图预测燃气管道泄漏的持续时间。我使用了15个功能,其中最重要的是“管道安装年”。我所拥有的最新泄漏数据是泄漏......

回答 1 投票 0

Python:sklearn kFold为关键字参数'shuffle'返回多个值

我正在尝试使用sklearn def train_and_evaluate(clf,X_train,y_train)执行经典kfold的交叉验证:clf.fit(X_train,y_train)#creal a k-fold cross validation iterator ...

回答 2 投票 0

使用for循环交叉验证模型时,请查看每个折叠的分数

我想看看每个拟合模型的个体得分,以便可视化交叉验证的强度(我这样做是为了向我的同事展示为什么交叉验证很重要)。我有一个.csv文件...

回答 1 投票 0

训练数据的分布与测试/预测的分布

训练数据所代表的分布是否需要反映测试数据的分布和您预测的数据?我可以通过查看...来衡量培训数据的质量吗?

回答 3 投票 2

如何为随机森林构建k-fold交叉验证

我是R初学者,我必须在随机森林模型中进行5或10倍交叉验证。我的问题是我必须手动执行cv而不是包。我想做的是:1。建立k -...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.