random-forest 相关问题

在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。

尝试创建汇总图时,二元分类中 SHAP 值的数组形状不正确

我正在尝试使用 SHAP 为随机森林分类模型制作一个非常简单的汇总图。只是为了看看我是否能得到正确的语法,我生成了一个玩具示例并随机适合......

回答 1 投票 0

cross_validate得到的auc和RocCurveDisplay的值不同

在训练随机森林分类器后,我尝试了两种计算 AUC 分数的方法。第一个是从 cross_validate 函数获取指标: numeric_transformer = make_pipeline(

回答 1 投票 0

我想优化/从我的变量重要性图中删除一些东西

我目前正在尝试可视化我的变量重要性图,但我的图看起来都被压扁了。我对 R 不太熟悉,所以我想问是否有人知道如何使绘图更具可读性/更好

回答 1 投票 0

当我尝试了所有测试并且得到了合理的分数时,为什么我的混淆矩阵是这样的?

我正在使用 sklearn 的随机森林分类,除了混淆矩阵之外,我在所有方面都得到了不错的结果,这里是代码和结果 火车的标签分布...

回答 1 投票 0

机器学习:为什么我的混淆矩阵是这样的?当我尝试了所有测试并且得到了合理的分数时

我正在使用 scklearn 的随机森林分类,除了混淆矩阵之外,我在所有方面都得到了不错的结果,这里是代码和结果 TRA的标签分布...

回答 1 投票 0

随机森林项目

我对机器学习非常陌生,这是我作为大学课程的一部分正在从事的第一个项目。我选择了英国足球比赛。我选择使用随机森林。 使用

回答 1 投票 0

RandomForestClassifier GridSearchCV 和显式编码的 RandomForestCLassifier 之间的 roc_auc_score 不同

为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...

回答 1 投票 0

在时间点对物种或群落相互作用进行建模

我收集了三个不同年份的丰度、混合分类群物种的数据,其中数据框的每一行对应于在独特地点观察到的物种。我从tr收集节肢动物...

回答 1 投票 0

RandomForestClassifier GridSearchCV 和显式编码的 RandomForestCLassifier 之间的 roc_auc_score 不同

为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...

回答 1 投票 0

auc_score 不同

为什么具有特定参数的经过训练的 RandomForestClassifier 无法与使用 GridSearchCV 改变这些参数的性能相匹配? def random_forest(X_train, y_train): 来自 sklearn.en...

回答 1 投票 0

SKLearn 算法比处理原生 NaN 值

我有一个很大的数据集,其中有很多缺失值。我在这里看到了处理原生 NaN 值的 SKLearn 算法列表:https://scikit-learn.org/stable/modules/impute.html#estimators-that-handle-nan-

回答 1 投票 0

部分依赖图 - 使用缩放数据开发的模型,如何取消 PDP 缩放?

我已经用Python制作了一个随机森林分类器模型,现在想要制作部分依赖图(PDP)。我使用缩放数据来训练和测试模型,并使 PDP 如下所示:

回答 1 投票 0

RandomForest n_estimators 计算 [已关闭]

我正在分析数据和训练模型,稍后将用于日期预测应用程序。目前,我的服务器上有大约 700 万行数据(表大小 = 6,400,000 行 x 8 列)。 我是

回答 1 投票 0

missForest 估算值不能小于最小观测值

我正在运行 missForest,使用附近的传感器填充温度数据的时间序列。似乎填充值无法低于我尝试的传感器的最低观察值...

回答 1 投票 0

种子在随机森林中起什么作用?

我知道通常使用种子设置,以便我们可以重现相同的结果。但是,在随机森林部分中设置种子实际上是做什么的。它是否改变了

回答 1 投票 0

randomForest R 包的奇怪结果

我有一个包含 10,000 行和两列的数据框、段(具有 32 个值的因子)和目标(具有两个值“是”和“否”的因子,每个值 5,000 个)。我正在尝试使用随机森林来

回答 2 投票 0

调试 RandomForestRegressor() 在时间序列数据上产生主要恒定的预测结果

假设我的数据集包含一个时间戳(没有日期时间格式的非标准时间戳列)作为单个特征,并计为标签/目标以在以下 pandas 数据帧中进行预测...

回答 2 投票 0

n_estimators 总能提高随机森林的性能?

我因 n_estimators 的最低值而获得最高分。据我了解,更多的树应该总是会提高性能。谁能解释一下这里发生了什么? 输入: # 是...

回答 1 投票 0

在 randomForestClassifier 上使用 GridsearchCV 时遇到的问题

我正在使用 RandomForestClassifier 处理与心脏病相关的分类问题。在对 RandomForestClassifier 执行超参数调整时,我面临以下问题。我是

回答 1 投票 0

使用 picke/joblib 保存随机森林分类器 (sklearn) 会创建巨大的文件

我正在尝试保存一堆经过训练的随机森林分类器,以便以后重用它们。为此,我尝试使用 pickle 或 joblib。我遇到的问题是,保存的文件变得......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.