交叉验证是一种评估和比较统计和机器学习中预测系统的方法。
在手动交叉验证和cross_val_score之间获取不同的指标值
我创建了一个 python for 循环,将训练数据集分割成分层的 KFold,并在循环内使用分类器来训练它。然后使用经过训练的模型通过验证数据进行预测。 ...
如何使用sklearn的cross_val_score()标准化数据
假设我想使用 LinearSVC 对数据集执行 k 折交叉验证。我如何对数据进行标准化? 我读过的最佳实践是建立标准化......
我实现了三种 ML 算法(K 最近邻、决策树和随机森林)并使用四种不同的交叉验证技术(保留方法、留一方法、K 折叠交叉验证.. .
Pyspark ML CrossValidator 评估多个评估器
在 GridSearchCV 的 Sklearn 中,我们可以为模型提供不同的评分,并且通过改装参数,我们使用整个数据集中找到的最佳参数来改装其中之一。 有什么办法吗
为什么在 k 倍的情况下需要单独的测试集,而不是在 LOOCV 的情况下?
为什么在 k 折的情况下需要单独的测试集,而在留一交叉验证(LOOCV)的情况下不需要? 怀疑在于交叉验证——我脑子里有某种困惑。当我们这样做时
我使用面板数据:我随着时间的推移观察许多单位(例如人);对于每个单元,我都有相同固定时间间隔的记录。 将数据分为训练集和测试集时,我们需要...
我有一个包含 3 个类别的数据集,这些数据集来自 40 个人。有些人有 3 类数据,有些人只有 2 类或 1 类数据。我正在尝试用一个 p 进行分类...
我一直在尝试对自闭症进行分类并拥有一个 CNN 模型。迄今为止论文中的最佳准确率约为 70-73%~,而我的模型在不同参数下的准确率约为 65-70%。我有...
我读到,一旦我使用 k 折交叉验证(在训练集上)调整了我的超参数,我应该在整个训练集上训练我的模型,然后在测试集上评估我的模型。
lgb.cv 和 cross_val_score 之间的差异导致使用 LightGBM 进行多类分类
我期望使用 lgb.cv 和 cross_val_score 时得到类似的交叉验证结果,但它们差异很大: 将 lightgbm 导入为 lgb 将 pandas 导入为 pd 从sklearn导入数据集 来自 sklearn.me...
多类分类中lgb.cv和cross_val_score的不一致
与通过 ScikitLearn API 和 cross_val_s 执行交叉验证相比,通过 lgbm 本机 API 使用 lgb.cv 执行交叉验证时,我得到的结果非常不同...
我正在使用带有交叉验证的sklearn(5倍)。 交叉验证。 我获取数据集并将其用于 5 倍交叉验证。 返回的分数(全部 5 个)在 0.80 到 0.85 范围内 直达火车...
为什么常规交叉验证的 roc auc 分数与超参数调整后的 roc auc 分数有很大不同?
我正在评估 XGBoost 分类器。我将数据集分为训练集和验证集,使用训练集与模型默认实现执行交叉验证,并计算 ROC AUC:
我想使用 sklearn 的 GridSearchCV 来训练具有某些特征集作为超参数的模型。 参数网格示例如下: [ { 'clf': [LogisticRegression()], 'cl...
如何在 scikit-learn 中将 SelectFromModel 与 cross_validate 结合使用?
在训练 DecisionTreeClassifier 模型之前,我尝试使用 SelectFromModel 从数据集中选择特征。我还使用 cross_validate 来评估模型性能。然而,我...
使用 StratifiedKFold 与外生组特征进行交叉验证
早上好/下午好, 我想在 sklearn 中使用交叉验证来预测连续变量。 我参考了“可视化 scikit-lear 中的交叉验证行为...
使用 MLPRegressor 访问 GridSearchCV 特定折叠中使用的数据点
我目前正在使用 scikit-learn 中的 GridSearchCV 和 Pipeline 进行超参数调整。我的估计器是 GradientBoostingRegressor。在交叉验证的过程中,我遇到了一个情况...
我是机器学习新手!我目前正在使用决策树分类器来解决我的文本分类问题,作为我的模型,我的训练准确度为 98%,但测试准确度仅为 48%...
我想利用Catboost来执行RFECV: 示例代码在这里: 从 sklearn.model_selection 导入 KFold 从 sklearn.metrics 导入 roc_auc_score 从 sklearn.model_selection 导入
我正在使用 StratifiedKFold 所以我的代码如下所示 def train_model(X,y,X_test,折叠,模型): 分数=[] 对于fold_n,枚举(folds.split(X,y))中的(train_index,valid_index): X_t...