在学习算法和统计分类中,随机森林是一个集合分类器,包含在许多决策树中。它输出的类是各个树输出的类的模式,换句话说,是具有最高频率的类。
我找不到计算此随机森林模型的 AUC 的语法。请参阅下面的代码;请指教。 ## 1 库(插入符号) 图书馆(dplyr) 库(pROC) 库(readxl) 图书馆(车) 设置.种子(1...
在解决一个机器学习问题时,我对训练数据实施 PCA,然后使用 sklearn 对训练数据应用 .transform。观察差异后,我只保留那些
我正在利用 Scikit-Learn 的随机森林库,我想知道是否可以更改特征权重,因此特定特征会产生更大的影响。我穿过随机森林
如何构建随机森林和粒子群优化器的混合模型来找到产品的最佳折扣?
我需要为每种产品(例如 A、B、C)找到最佳折扣,以便最大化总销售额。我对每种产品都有现有的随机森林模型,将折扣和季节映射到销售。 ...
使用 sklearn 的 RandomForestRegressor 进行预测
这是我的数据的样子...... 日期、区域设置、类别、网站、alexa_rank、会话、user_logins 20170110,美国,1,谷歌,1,500,5000 20170110,欧盟,1,谷歌,2,400,2000 20170111,美国,2,facebook,2,400,2000 ... 一个...
在信用风险分析中是否可以识别哪些指标影响每个客户公司的信用风险?
我正在从事信用风险分析。我想预测每家公司与虚构公司产生债务的风险。我从模型中获得了特征重要性,但我想知道是否...
将 pandas Interval 转换为字符串(然后再返回)
我对 Python 比较陌生,正在尝试获取一些准备训练随机森林的数据。 由于各种原因,我们希望数据是离散的,因此需要一些连续变量......
我正在尝试使用当前和已经流失的客户的数据库来预测客户流失。 到目前为止我已经 获取当前客户和已经流失客户的完整客户数据库...
我正在尝试使用机器学习来预测数据集。这是一个具有 180 个输入特征和 1 个连续值输出的回归问题。我尝试比较神经网络、随机森林回归......
X 有 8 个特征,但 RandomForestRegressor 预计有 2924 个特征作为输入
这可能看起来很微不足道,但我就是不明白这个问题。基本上,我正在使用 Kaggle 数据集和 RandomForestRegressor 为我的城市构建一个餐厅推荐系统。 我建造了
带有随机森林的ClassifierChain:为什么即使基本估计器可以处理 np.nan 也不支持它?
我正在使用 ClassifierChain 方法和 RandomForestClassifier 作为基本估计器来解决多标签分类问题。我遇到了一个问题,我的输入矩阵 X 包含 n...
我有关于 XGBoost 的问题。 你知道如何知道XGBoost中创建的树的数量吗? 与 RandomForest 不同,模型制作者决定制作多少棵树,XGBoost 基本上继续
我有一个线性回归随机森林模型,可以根据一组变量预测植物高度。 培训<- read.csv('/sers/me/Desktop/training_data.csv') rf_model <- randomForest(height ~ E...
我有一个数据集,其中包含从虚构公司购买商品的客户的个人特征。最初,我没有任何目标变量,只有它们的特征。我的目标是找到拍拍...
我的目标是计算客户离开公司的流失风险。我想到了这种方法: 生成代表 cos 中最突出特征的配置文件...
我正在开发一个项目,旨在使用一个包含已离开公司人员历史的数据库,并根据那些已经离开公司的人员的个人资料来计算在职员工离职的风险...
我使用 6 月数据集训练了随机森林模型来预测员工的 status_value,并使用 0.3 分割作为 test_size。我将代码片段包含在内,因为它本身可以很好地工作而无需......
在 python 中将 ee.Image.stratifiedSample 与 .smileRandomForest、.train 和 .classify 一起使用?
我想使用 .stratifiedSample 从具有四个类别(标记为 0-3,表示频谱索引一致)的集成层创建训练数据,然后使用该输出来训练 .
我正在使用随机森林模型和神经网络进行二元分类,其中使用 SHAP 来解释模型预测。我按照教程编写了以下代码以获得
我正在对几种机器学习模型(例如 svm、ann、随机森林和 knn)进行 covid 19 爆发预测。我很困惑如何比较哪个是最好的