random-forest 相关问题

在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。

R:任何可以控制树的最大深度的随机森林包?

我试图解决的特定问题要求我控制随机森林模型中树木的深度。最流行的 randomForest 包不允许用户精确控制最大值...

回答 2 投票 0

测试精度大于训练精度怎么办?

我正在使用随机森林。我的测试准确率是 70%,而训练准确率是 34% ?该怎么办 ?我该如何解决这个问题。

回答 4 投票 0

随机森林 pred_proba 输出四舍五入值

我在 scikit learn 中使用随机森林进行分类并获取类概率,我使用了 pred_proba 函数。但它输出的概率四舍五入到小数点后第一位 我尝试...

回答 1 投票 0

随机森林分类算法的训练类型与测试误差(评估方差)

如果可能的话,我想确定两个问题(问题以粗体显示): 我最近了解了(我希望)随机森林分类算法,并尝试使用它来应用它

回答 1 投票 0

随机森林算法中的置信度与概率

我一直在尝试使用 scikit-learn 运行随机森林分类器。我想了解概率和置信度之间的区别。假设我们有 5 个类别 A、B、C、D、E 。现在如果...

回答 1 投票 0

随机森林:%IncMSE 和 %NodePurity 之间不匹配

我在一个相当小的数据集(即 11 个变量的 28 个观测值)上对 100,000 个分类树进行了随机森林分析。 然后我画了变量重要性的图 在结果中...

回答 1 投票 0

使用“iml”包评估 REEMforest 和 MERF 的变量重要性

我最近开始使用 LongituRF 包。 我正在将其拟合到一些数据,并且我想使用 iml 包评估变量的重要性。 我已经使用过 iml,我喜欢它

回答 1 投票 0

在Python中拟合随机森林模型时出现InvalidParameterError

rf = 随机森林分类器(random_state=25) cv_params = {'最大深度': [2,4,6,无], 'min_samples_leaf': [1,2], 'min_samples_split':[2,3], '最大特征':[...

回答 1 投票 0

使用随机森林时,scikit 中的“ValueError:max_features 必须位于 (0, n_features] ”

我有一个包含 20 个特征和 840 行的数据集。 我已经优化了分类器(随机森林)。我的参数是 n_estimators=100 和 max_features=5。 我想对每个

回答 1 投票 0

替换随机森林物品

我正在运行这里开发的R中的MRF示例。以下块可以完美运行: 设置.seed(0) 数据=矩阵(rnorm(15*200),200,15) #DGP 图书馆(pracma) X=数据[,1:3] y=crossprod(t(X),rep(1,3))*(1-...

回答 1 投票 0

随机森林分类器使用Top-N特征方法去除特征

我是数据科学和机器学习技术和流程的新手。我正在开展一个个人项目,该项目使用随机森林分类器预测 NBA 比赛的获胜者。我有那么...

回答 1 投票 0

混合模型(CNN + RF)超参数优化

我正在研究一种混合模型,该模型在全连接层结合使用 CNN(时间序列输入)和 H2oRandom 森林(表格数据输入)来解决回归问题。我想优化...

回答 1 投票 0

使用 Scikit-learn 确定 RF 模型中每个类的特征重要性

我有一个遵循one-hot编码模式的数据集,我的因变量也是二进制的。我的代码的第一部分列出了整个数据集的重要变量。我用了方法...

回答 2 投票 0

提高使用随机森林模型预测新数据的速度

我正在使用随机森林生成物种分布模型。这些模型试图根据各种环境属性来预测某个物种发生的概率。对于我...

回答 1 投票 0

宏观经济作为随机森林项目来替代

我正在运行这里开发的R中的MRF示例。以下块可以完美运行: 设置.seed(0) 数据=矩阵(rnorm(15*200),200,15) #DGP 图书馆(pracma) X=数据[,1:3] y=crossprod(t(X),rep(1,3))*(1-...

回答 1 投票 0

是否可以在 XGBoost 包随机森林中收集单个树预测?

我有一个使用 python 中的 xgboost 包制作的模型,我想知道是否可以在将单个树预测打包(平均)到 ca 之前存储和引用它们...

回答 1 投票 0

如何让RandomForestClassifier更快?

我正在尝试使用具有大约 100 万原始数据的 Twitter 情绪数据来实现 Kaggle 网站的词袋模型。我已经清理了它,但在最后一部分,当我应用我的特征向量和情感时......

回答 1 投票 0

R Tidymodels 随机森林分类:预测目标变量时出错

我有一个包含 90 个变量和 200000 个 obs 的数据集。它是不平衡的,因为只有 4% 的情况目标变量为 1,在所有其他情况下目标变量为 0。 我将其分为 2 组:拟合(185000)和保留

回答 1 投票 0

mtry 值取决于tuneGrid 范围,即使使用相同的种子

我正在尝试寻找条件随机森林的最佳 mtry 值。我在 caret::train 函数的帮助下做到了这一点,发现根据网格范围,我甚至得到了不同的最佳 mtry...

回答 1 投票 0

机器学习模型是否可以通过将其概率指定为“两者都不”来预测新数据不适合用于训练的任何类别?

我正在 python 中使用 sklearn.ensemble 中的 RandomForestClassifier 来训练 ML 模型。我有 2 个类/模型(比如 A 和 B)可以生成曲线。在输入中,每一行代表一条曲线,e...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.