random-forest 相关问题

在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。

randomForest从测试集中预测错误

[randomForest R包出现错误,在使用Caret将数据分割为训练和测试后,当我去预测时,我遇到了错误:预测中的错误。]] >> < [

回答 2 投票 0

`$]中的错误>

[Good Day,我运行了一个带有调整的随机森林,并将预测添加到Train数据中,该数据运行得很好,没有问题。但是,当我尝试在...

回答 1 投票 0

从随机森林中提取一棵树,然后将提取的树用于预测

作为示例,让我们使用虹膜数据集。库(randomForest)数据(iris)smp_size

回答 1 投票 0

如何解决R中未定义的列选择错误?

不过,我不太适合在项目中使用caret r软件包,我打算使用套索或randomforest进行预测。我使用randomforest对数据进行了预测,但由于出现了怪异的错误,因为...

回答 1 投票 1

在看不见的数据上所有概率值均小于0.5

我有15个具有二进制响应变量的特征,并且我对预测概率的兴趣大于0或1个类别标签。当我训练和测试500棵树的RF模型时,CV是平衡类...

回答 1 投票 1

随机森林中看不见的数据,predict_proba()中的所有概率值都在0到0.5之间?

我有15个具有二进制响应变量的特征,并且我对预测0或1类标签之外的概率感兴趣。当我训练和测试500棵树的RF模型时,CV,平衡类...

回答 1 投票 0

用于计算随机森林MSE的嵌套循环

我正在尝试为通过更改mtry,nodesize和ntree参数创建的多个随机森林计算MSE。我将这些参数用作randomForest函数中的变量,并创建了...

回答 1 投票 0

Random Forest Regressor,试图让树文本显示出来

从sklearn.ensemble导入RandomForestRegressor model = RandomForestRegressor()model.fit(X_train,y_train)model.score(X_test,y_test)feature_list = list(X.columns)r = export_text(model,...

回答 1 投票 0

将sklearn随机森林模型传输到新服务器

我在旧服务器上使用sklearn RandomForestClassifier建立了一个模型,现在我需要将其迁移到另一台服务器。如何将模型转移到新服务器?我应该使用哪个Python包?...

回答 1 投票 1

AUC for Random Forest-不同的方法,不同的答案?

我正在尝试找到一种方法为我提供一个用于训练和测试集的随机森林模型的AUC,而不使用MLeval。这是中华民国关于训练数据的一个很好的例子,这是一个...

回答 1 投票 0

您是否应该在基于树的模型中缩放数字分类特征?

我正在缩放基于树的分类器的数据,我知道这是没有必要的(但也不应该受到伤害)。我的大部分功能都是定量的,但我还有“ day_of_week”,剩下的是0-6(不是...

回答 1 投票 0


R的'randomForest'库的'rfcv()'函数中的'mtry'

我想使用交叉验证来确定要在“随机森林”方法中尝试的变量的数量。我不明白如何在rfcv()函数中使用mtry参数。我有6个...

回答 1 投票 0

将随机森林预测作为列添加到测试文件中

我正在使用python pandas(在Jupyter笔记本中)工作,在那里我为Titanic数据集创建了Random Forest模型。 https://www.kaggle.com/c/titanic/data我在测试中读取并训练了数据,然后我...

回答 1 投票 3

随机森林精度是否与Spark中的分区数有关?

在Spark中,随机森林分类器的准确性与训练数据占用的分区数量之间是否有任何关系?例如,我们将训练数据存储在10 ...

回答 1 投票 0

sklearn随机森林分类器可以处理类别变量吗?

我从2014年开始发现此线程,答案指出,不,sklearn随机森林分类器无法处理分类变量(或至少不能直接处理)。答案在2020年有变化吗?我想...

回答 1 投票 2

巨大的随机森林模型:减少内存的技巧?

我有100种不同的随机森林模型。他们每个人的平均大小为300 MB(每个人接受300多个课程的培训)。我正在使用sklearn(v0.19.1)的随机森林实现。结果是...

回答 1 投票 -1

Python中的随机森林可视化

TypeError追溯(最近一次通话最近) in 3 feature_names = fn,4 ... ] >>

回答 1 投票 0

用于sklearn集成的自定义随机采样

我需要在scikit-learn中编写一个自定义random_selection(用于特征的随机选择,例如“ max_feature”和训练数据的子集,即“ subsample”),以便与sklearn.ensemble ...一起使用。]] >> < [

回答 1 投票 0

对于大的缺失,插补与对随机森林的可用子集进行训练相比有什么优势?

我想在缺失较大的数据集上训练随机森林模型。我知道“标准方法”,即我们在训练集中估算缺少的数据,对...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.