random-forest 相关问题

在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。

随机森林优化

我有这段代码,但它必须迭代超过 2000 列和 3000 行,有人可以帮我避免 for 循环吗? 数据是取自雅虎金融包的经典数据,因此它们具有 adj close, close,...

回答 0 投票 0

set.seed() R 中的机器学习模型

谁能澄清在运行机器学习算法之前 set.seed() 的最佳程序是什么? 我建立了一个随机森林模型,一个gbm模型和一个bart模型。 他们每个人都需要一个

回答 1 投票 0

NameError: name 'capture' is not defined

我正在编写一些人脸识别代码。我正在尝试将我拥有的 csv 文件合并到一个程序将读取的文件中,一旦它的准确度级别至少为 0.8 或更高...

回答 5 投票 0

第 4 类和第 5 类精度值较低的多类分类问题

我有分类数据集。在 sata 数据集中有 5 个分类,即 1、2、3、4 和 5。我对机器学习(随机森林分类器)进行建模以创建分类模型。呵呵……

回答 0 投票 0

使用随机森林的单变量自回归预测提前 4 步

我一直在尝试使用随机森林进行时间序列预测,遵循一些这样的例子。但是,我仍然不清楚如何预测超出最后一天的值......

回答 0 投票 0

sklearn RandomForestRegressor:可训练参数的数量

有没有办法从 sklearn RandomForestRegressor 中提取模型训练期间适合的(有效)可训练参数数量? 可训练参数的数量可用于

回答 2 投票 0

X 有 29 个特征,但 RandomForestClassifier 期望 30 个特征作为输入

我正在尝试编写一个使用 RandomForestClassifier 预测乳腺癌的机器学习模型。代码如下所示: 从 sklearn.model_selection 导入 train_test_split 打印(“

回答 1 投票 0

循环查找 python 中的最大 R2

我正在尝试制作决策树但优化采样值以使用。 我正在使用一组值,例如: 数据 1 数据 2 数据 3 值 100 300 400 ...

回答 1 投票 0

如何使用不平衡数据集训练神经网络模型?

我正在尝试制作一个具有 3 个隐藏层的神经网络来区分信号和背景事件。我正在使用由蒙特卡洛生成器生成的事件。 我面临的问题是 nu...

回答 0 投票 0

使用 Caret 的 R 中各个类的变量重要性

我使用随机森林来预测类别。现在,我正在尝试绘制每个班级的变量重要性。我使用了下面的代码,但它并没有为我提供 varImp 类,而是 givi...

回答 2 投票 0

随机森林 - 出了点问题;所有 RMSE 指标值都缺失

我想将随机森林技术应用于我的时间序列数据。首先,我只是想加入一堆回归变量,并想为我的模型生成最佳数量的树。 然而,e...

回答 0 投票 0

可视化工具“ROCAUC”和包装估计器“RandomForestClassifier”都没有属性“target_type_”

我从以下代码中得到标题的错误: clf = RandomForestClassifier(n_estimators=n_tree, max_depth=depth_tree, class_weight='balanced') clf.fit(x, y0) compl.append(clf.s...

回答 0 投票 0

算法优化

我有一个像这样但更大的数据框。 一月 二月 价格 金额名称 价格 金额名称 2011-03-31 2 7 3 6 0 5 2011-0...

回答 0 投票 0

如何为我的 ML 模型添加超参数调整和交叉验证?

我有这个集成学习功能,它训练多个 lightGBM 模型,然后使用这些模型的预测分数(对于每个单独的样本)作为预测特征,以及

回答 0 投票 0

如何提高随机森林分类器的准确率?

我有一个森林分类器。其准确率约为 61%。我想尝试提高准确性,但我已经尝试过的并没有大大提高准确性。代码如下所示: # 导入时间模块...

回答 1 投票 0

ValueError:X 有 302 个特征,但 RandomForestClassifier 期望 428 个特征作为输入

从 sklearn.ensemble 导入 RandomForestClassifier #我改变了数据集路径 dataset_df = pd.read_csv(r"C:\dataset ndroid_dataset-v2.csv") Y = dataset_df['类'] X = 数据集_d...

回答 0 投票 0

Missforest fit_transform 缺失值插补耗时过长

我这里有一个数据集,但是文件太大了,我不得不把它分成多个“output.csv”文件。上传到这个 github 上的是整个数据集的三分之一,b ...

回答 0 投票 0

我正在尝试绘制图表,但我的所有输出都与下一个单元格重叠,为什么它不腾出额外的空间?

我正在尝试运行一个模拟,该模拟将在模拟实时时绘制当前压力值,同时还使用我的随机森林来同时预测压力,同时绘制两个实时....

回答 0 投票 0

纵向随机森林

我最近接触了 ML,想分析运动员的纵向数据集。在研究适合的 ML 应用程序时,我偶然发现了 Louis Capitaine 的 SREEMFOREST,但是我有

回答 0 投票 0

如何计算 K 折交叉验证的不平衡数据集的精度、召回率和 f1 分数?

我有一个包含二元分类问题的不平衡数据集。我构建了随机森林分类器并使用了 10 折的 k 折交叉验证。 kfold = model_selection.KFold(n_splits...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.