random-forest 相关问题

在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。

随机森林项目

我对机器学习非常陌生,这是我作为大学课程的一部分正在从事的第一个项目。我选择了英国足球比赛。我选择使用随机森林。 使用

回答 1 投票 0

RandomForestClassifier GridSearchCV 和显式编码的 RandomForestCLassifier 之间的 roc_auc_score 不同

为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...

回答 1 投票 0

在时间点对物种或群落相互作用进行建模

我收集了三个不同年份的丰度、混合分类群物种的数据,其中数据框的每一行对应于在独特地点观察到的物种。我从tr收集节肢动物...

回答 1 投票 0

RandomForestClassifier GridSearchCV 和显式编码的 RandomForestCLassifier 之间的 roc_auc_score 不同

为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...

回答 1 投票 0

auc_score 不同

为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...

回答 1 投票 0

SKLearn 算法比处理原生 NaN 值

我有一个很大的数据集,其中有很多缺失值。我在这里看到了处理原生 NaN 值的 SKLearn 算法列表:https://scikit-learn.org/stable/modules/impute.html#estimators-that-handle-nan-

回答 1 投票 0

部分依赖图 - 使用缩放数据开发的模型,如何取消 PDP 缩放?

我已经用Python制作了一个随机森林分类器模型,现在想要制作部分依赖图(PDP)。我使用缩放数据来训练和测试模型,并使 PDP 如下所示:

回答 1 投票 0

RandomForest n_estimators 计算 [已关闭]

我正在分析数据和训练模型,稍后将用于日期预测应用程序。目前,我的服务器上有大约 700 万行数据(表大小 = 6,400,000 行 x 8 列)。 我是

回答 1 投票 0

missForest 估算值不能小于最小观测值

我正在运行 missForest,使用附近的传感器填充温度数据的时间序列。似乎填充值无法低于我尝试的传感器的最低观察值...

回答 1 投票 0

种子在随机森林中起什么作用?

我知道通常使用种子设置,以便我们可以重现相同的结果。但是,在随机森林部分中设置种子实际上是做什么的。它是否改变了

回答 1 投票 0

randomForest R 包的奇怪结果

我有一个包含 10,000 行和两列的数据框、段(具有 32 个值的因子)和目标(具有两个值“是”和“否”的因子,每个值 5,000 个)。我正在尝试使用随机森林来

回答 2 投票 0

调试 RandomForestRegressor() 在时间序列数据上产生主要恒定的预测结果

假设我的数据集包含一个时间戳(没有日期时间格式的非标准时间戳列)作为单个特征,并计为标签/目标以在以下 pandas 数据帧中进行预测...

回答 2 投票 0

n_estimators 总能提高随机森林的性能?

我因 n_estimators 的最低值而获得最高分。据我了解,更多的树应该总是会提高性能。谁能解释一下这里发生了什么? 输入: # 是...

回答 1 投票 0

在 randomForestClassifier 上使用 GridsearchCV 时遇到的问题

我正在使用 RandomForestClassifier 处理与心脏病相关的分类问题。在对 RandomForestClassifier 执行超参数调整时,我面临以下问题。我是

回答 1 投票 0

使用 picke/joblib 保存随机森林分类器 (sklearn) 会创建巨大的文件

我正在尝试保存一堆经过训练的随机森林分类器,以便以后重用它们。为此,我尝试使用 pickle 或 joblib。我遇到的问题是,保存的文件变得......

回答 1 投票 0

带有随机森林 SHAP 值的蜂群图

我之前尝试使用随机森林可视化 SHAP 值的结果。 我正在处理这段代码: # 加载必要的库 库(随机森林) 图书馆(DALEX) 图书馆(beeswa...

回答 1 投票 0

Optuna 随机森林分类器剪枝试验

我目前正在研究 Optuna 库,我发现有一个参数可以删除没有希望的试验。看来这个参数只能用在增量学习中

回答 1 投票 0

Optuna 用于随机森林分类器的修剪轨迹

我目前正在研究 Optuna 库,我发现有一个参数可以删除没有希望的试验。看来这个参数只能用在增量学习中

回答 1 投票 0

访问 gridsearchcv 随机森林中的 model.best_estimator_.feature_importances_

我正在使用 RAPID AI 的 cuml。我使用 gridsearchcv 来查找最佳参数,但是我无法获得最佳功能(用于功能选择目的)。 这是我的代码: 组合_df=cpd.c...

回答 1 投票 0

scikit-learn RandomForestClassifier 中的子样本大小

如何控制用于训练森林中每棵树的子样本的大小? 根据 scikit-learn 的文档: 随机森林是一种元估计器......

回答 3 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.