cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

为什么我的重要模型给我的 AUC 和 ROC 很低?

出于某种原因,在通过混淆矩阵和 AUC ROC 检查其准确性时,我的模型一直显示为较差的模型。这是我在进行向后消除后坚持使用的模型......

回答 0 投票 0

使用 scikit-survival 评估单个 GridSearchCV 中的多个指标

目前,我正在做一个模拟来比较多个模型,我的研究不需要 best_estimator_ 只需要来自 cv_results_ 的结果。我遇到的问题是我需要

回答 0 投票 0

交叉验证逻辑回归返回非常不同的准确度

我在逻辑回归上运行交叉验证,我遇到了一个奇怪的问题,训练和测试准确率都是 100%,除了第一次和第二次折叠,大约是 66%

回答 0 投票 0

如何在具有多个二元分类输出的神经网络上进行交叉验证?

我正在尝试使用 StratifiedKFold 在输出多个二元分类的 CNN 上进行交叉验证。但是,StratifiedKFold 无法处理多标签指标。 斯克夫 =

回答 0 投票 0

交叉验证期间的数据转换

我在 h2o.ai 中使用 H20GeneralizedLinearEstimator。 我计划使用交叉验证内置选项来获得交叉验证的性能。在拟合模型之前,我执行一些

回答 0 投票 0

如何为我的 ML 模型添加超参数调整和交叉验证?

我有这个集成学习功能,它训练多个 lightGBM 模型,然后使用这些模型的预测分数(对于每个单独的样本)作为预测特征,以及

回答 0 投票 0

如何计算 K 折交叉验证的不平衡数据集的精度、召回率和 f1 分数?

我有一个包含二元分类问题的不平衡数据集。我构建了随机森林分类器并使用了 10 折的 k 折交叉验证。 kfold = model_selection.KFold(n_splits...

回答 2 投票 0

XGBoost 和随机森林模型的嵌套交叉验证

内折和外折好像不太对。我不确定我是否正确使用了训练和测试数据集。 欢迎任何帮助:) ... # 缩放数据 定标器 = StandardScaler()

回答 0 投票 0

在数据帧上使用 TimeSeriesSplit() 应用交叉验证的最佳实践是什么,包括在 python 中可视化数据拆分?

假设我有以下 pandas 数据框格式的数据集,其中包含一个没有日期时间格式的非标准时间戳列,如下所示: +--------+-----+ |TS_24hrs|计数| +--------+-----+ |0 ...

回答 0 投票 0

使用 lightgbm 时如何抑制警告消息?

我正在使用 lightgbm 在 R 中训练 LGBM 模型。但是,每当我调用 lgb.cv() 函数时,都会出现很多警告消息。 我的代码写成: 火车参数<- list(objective = "binary...

回答 1 投票 0

在嵌套的 GridSearchCV 管道中输入缺失值以避免数据泄漏

我对 sklearn 在已建立的 CV 和管道框架内估算值的方式有一些问题。所有这些都是为了避免全局插补,这会扰乱模型的性能......

回答 0 投票 0

NotFittedError(实例尚未安装)调用 cross_validate

这是我最小的可重现示例: x = np.array([ [1, 2], [3, 4], [5, 6], [6, 7] ]) y = [1, 0, 0, 1] 模型 = GaussianNB() scores = cross_validate(model, x, y, cv=2, scoring=(&q...

回答 1 投票 0

Scikit-Learn 交叉验证功能在索引不连续时不允许自定义折叠

尝试将自定义交叉验证折叠传递给 sklearn 的交叉验证功能。 交叉验证函数似乎会触发错误,因为它坚持使用基于位置的

回答 0 投票 0

k 折交叉验证中的训练、验证、测试拆分

假设我只有 100 个数据点,我想使用 10 折交叉验证方法。我应该使用多少个数据点进行训练? 我应该像往常一样将数据分成训练/测试,比如 80 ...

回答 0 投票 0

如何确保 nestcv.train 函数每次都返回相同的结果? Set.seed() 不工作

在这里输入图片描述 以上是我的脚本。我正在尝试使用线性 SVM 的 nestcv.train() 函数进行嵌套交叉验证 (CV)。即使我使用了 set.seed(),它给了我不同的

回答 0 投票 0

sklearn中RepeatedStratifiedKFold和StratifiedKFold的区别

我试图阅读 RepeatedStratifiedKFold 和 StratifiedKFold 的文档,但除了 RepeatedStratifiedKFold 重复 StratifiedKFold n 次外,无法分辨这两种方法之间的区别

回答 1 投票 0

连续数据,BayesianRidge 的 IterativeImputer 的 cross_val_score() binary|multiclass 不支持 Y 响应

问题定义,持续挑战 这个新的 imputer_bayesian_ridge() 函数用于 Iterative Imputer 来插补训练数据。送入data frame训练数据,立马得到data.val...

回答 1 投票 0

错误:在 StratifiedK-fold 期间出现“条件预期的布尔数组,而不是 float64”

我正在尝试使用 stratifid k-fold 对我的数据集进行交叉验证,但存在错误“条件预期的布尔数组,而不是 float64”(在下面的标题代码中)。做

回答 1 投票 0

如何绘制多类分类中每个类的平均折叠的 ROC 曲线

我在多类分类上使用 5 个交叉验证来评估随机森林的性能。我得到的曲线就像图片 在此处输入图像描述 我使用的代码是...

回答 0 投票 0

为什么 sklearn 的 KFold 只能枚举一次(也在 xgboost.cv 中使用它)?

尝试为我的 xgboost.cv 创建一个 KFold 对象,我有 将熊猫导入为 pd 从 sklearn.model_selection 导入 KFold df = pd.DataFrame([[1,2,3,4,5],[6,7,8,9,10]]) KF = KFold(n_splits=2) kf...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.