cross-validation 相关问题

交叉验证是一种评估和比较统计和机器学习中预测系统的方法。

在手动交叉验证和cross_val_score之间获取不同的指标值

我创建了一个 python for 循环,将训练数据集分割成分层的 KFold,并在循环内使用分类器来训练它。然后使用经过训练的模型通过验证数据进行预测。 ...

回答 1 投票 0

如何使用sklearn的cross_val_score()标准化数据

假设我想使用 LinearSVC 对数据集执行 k 折交叉验证。我如何对数据进行标准化? 我读过的最佳实践是建立标准化......

回答 1 投票 0

不同的交叉验证技术产生相同的评估指标

我实现了三种 ML 算法(K 最近邻、决策树和随机森林)并使用四种不同的交叉验证技术(保留方法、留一方法、K 折叠交叉验证.. .

回答 1 投票 0

Pyspark ML CrossValidator 评估多个评估器

在 GridSearchCV 的 Sklearn 中,我们可以为模型提供不同的评分,并且通过改装参数,我们使用整个数据集中找到的最佳参数来改装其中之一。 有什么办法吗

回答 1 投票 0

为什么在 k 倍的情况下需要单独的测试集,而不是在 LOOCV 的情况下?

为什么在 k 折的情况下需要单独的测试集,而在留一交叉验证(LOOCV)的情况下不需要? 怀疑在于交叉验证——我脑子里有某种困惑。当我们这样做时

回答 1 投票 0

分组时间序列(面板)数据的交叉验证

我使用面板数据:我随着时间的推移观察许多单位(例如人);对于每个单元,我都有相同固定时间间隔的记录。 将数据分为训练集和测试集时,我们需要...

回答 2 投票 0

不平衡数据集的分类

我有一个包含 3 个类别的数据集,这些数据集来自 40 个人。有些人有 3 类数据,有些人只有 2 类或 1 类数据。我正在尝试用一个 p 进行分类...

回答 1 投票 0

为什么我的交叉验证模型给出 100% 的验证准确度?

我一直在尝试对自闭症进行分类并拥有一个 CNN 模型。迄今为止论文中的最佳准确率约为 70-73%~,而我的模型在不同参数下的准确率约为 65-70%。我有...

回答 1 投票 0

交叉验证后做什么

我读到,一旦我使用 k 折交叉验证(在训练集上)调整了我的超参数,我应该在整个训练集上训练我的模型,然后在测试集上评估我的模型。

回答 1 投票 0

lgb.cv 和 cross_val_score 之间的差异导致使用 LightGBM 进行多类分类

我期望使用 lgb.cv 和 cross_val_score 时得到类似的交叉验证结果,但它们差异很大: 将 lightgbm 导入为 lgb 将 pandas 导入为 pd 从sklearn导入数据集 来自 sklearn.me...

回答 1 投票 0

多类分类中lgb.cv和cross_val_score的不一致

与通过 ScikitLearn API 和 cross_val_s 执行交叉验证相比,通过 lgbm 本机 API 使用 lgb.cv 执行交叉验证时,我得到的结果非常不同...

回答 1 投票 0

交叉验证和测试性能的差异

我正在使用带有交叉验证的sklearn(5倍)。 交叉验证。 我获取数据集并将其用于 5 倍交叉验证。 返回的分数(全部 5 个)在 0.80 到 0.85 范围内 直达火车...

回答 1 投票 0

为什么常规交叉验证的 roc auc 分数与超参数调整后的 roc auc 分数有很大不同?

我正在评估 XGBoost 分类器。我将数据集分为训练集和验证集,使用训练集与模型默认实现执行交叉验证,并计算 ROC AUC:

回答 1 投票 0

指定 GridSearchCV 的参数网格中要选择的列

我想使用 sklearn 的 GridSearchCV 来训练具有某些特征集作为超参数的模型。 参数网格示例如下: [ { 'clf': [LogisticRegression()], 'cl...

回答 1 投票 0

如何在 scikit-learn 中将 SelectFromModel 与 cross_validate 结合使用?

在训练 DecisionTreeClassifier 模型之前,我尝试使用 SelectFromModel 从数据集中选择特征。我还使用 cross_validate 来评估模型性能。然而,我...

回答 1 投票 0

使用 StratifiedKFold 与外生组特征进行交叉验证

早上好/下午好, 我想在 sklearn 中使用交叉验证来预测连续变量。 我参考了“可视化 scikit-lear 中的交叉验证行为...

回答 1 投票 0

使用 MLPRegressor 访问 GridSearchCV 特定折叠中使用的数据点

我目前正在使用 scikit-learn 中的 GridSearchCV 和 Pipeline 进行超参数调整。我的估计器是 GradientBoostingRegressor。在交叉验证的过程中,我遇到了一个情况...

回答 1 投票 0

如何提高测试准确度?

我是机器学习新手!我目前正在使用决策树分类器来解决我的文本分类问题,作为我的模型,我的训练准确度为 98%,但测试准确度仅为 48%...

回答 1 投票 0

使用 catboost 作为估计器时 RFECV 抛出错误

我想利用Catboost来执行RFECV: 示例代码在这里: 从 sklearn.model_selection 导入 KFold 从 sklearn.metrics 导入 roc_auc_score 从 sklearn.model_selection 导入

回答 1 投票 0

通过 K-Fold 交叉验证标准化数据

我正在使用 StratifiedKFold 所以我的代码如下所示 def train_model(X,y,X_test,折叠,模型): 分数=[] 对于fold_n,枚举(folds.split(X,y))中的(train_index,valid_index): X_t...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.