feature-selection 相关问题

在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。

在 sklearn 管道中使用固定特征实现自定义套索回归以进行变量选择

R 语言中有两篇与此主题相关的帖子,包括 Lasso 回归模型中的固定回归量和固定效应 Lasso logit 模型 我正在使用 Lasso 编写一个特征选择模型

回答 1 投票 0

属性错误:“ParticleSwarmOptimization”对象没有属性“global_best_fitnes”

用于特征选择的执行代码 PSO 错误 定义健身(位置): selected_features = np.array(位置, dtype=bool) X_selected = X.iloc[:, selected_features] X_train,X_test,y_...

回答 1 投票 0

如何恢复或转换one-hot编码列并显示原始特征的特征重要性而不是编码形式?

使用RandomForestClassifier,这是当前重要的功能列表: 帐单长度 0.367075 鳍状肢长度毫米 0.196314 帐单深度 0.153329 身体质量g 0.152304

回答 1 投票 0

RFE 与 GBM 的集成,用于特征选择和超参数调整

我叫Lucas,对机器学习领域比较陌生。我在一些在线文档和教程的帮助下编写了这段代码。不过,我需要一些帮助

回答 1 投票 0

有没有办法评估模型是否能够识别有影响的变量(使用make_classification生成的变量)?

我有一个关于 scikit-learn 的 make_classification 的问题。我使用 make_classification (二元分类任务)创建了一个数据集,目的是测试不同模型的表现

回答 1 投票 0

有没有办法在模型拟合后检索 SequentialFeatureSelection 的系数?

我正在尝试进行特征选择,以识别与响应相关的特征。到目前为止,我已经使用了 sklearn 中的 RFE、RFECV、SelectFromModel 和 SequentialFeatureSelection。莫之后...

回答 1 投票 0

使用 SelectKBest 从 3D numpy 数组中自动选择特征

我是机器学习新手,正在处理一个非常复杂的问题。我有一个名为“psd_data”的 3D numpy 数组,其中包含来自执行运动想象三项的人类受试者的脑电图数据...

回答 2 投票 0

如何在 R XGboost 中找到每个预测的重要变量

我将 xgboost 应用于以下数据集并进行预测,我也能够获得整个模型最重要的特征,但是我也想知道每个预测...

回答 1 投票 0

在 scikit-learn 和 PCA 中使用向后特征选择进行特征选择

我已经使用 PCA 计算了 DF 中所有列的分数,该 DF 有 312 列和 650 行,代码如下: all_pca=PCA(random_state=4) all_pca.fit(tt) all_pca2=all_pca.transform(tt...

回答 1 投票 0

Okapi BM25在python中的实现

我正在尝试用Python实现Okapi BM25。虽然我看过一些教程如何做到这一点,但我似乎陷入了这个过程。 所以我收集了文档(并且有“id”和“t”列......

回答 3 投票 0

使用 RFECV 和排列重要性的正确方法 - Sklearn

Sklearn #15075 中有一个实现这一点的提案,但与此同时,建议使用 eli5 作为解决方案。但是,我不确定我是否以正确的方式使用它。这是我的代码: 来自 sklearn.dat...

回答 2 投票 0

WEKA凯姆套餐

在网络搜索上找不到任何用于 CAIM 离散化的 WEKA 包。我需要 WEKA v3 的软件包。 在谷歌上搜索 WEKA 包,但没有找到任何包,尽管有些文档说它存在。 谁都可以吗

回答 1 投票 0

随机森林分类器使用Top-N特征方法去除特征

我是数据科学和机器学习技术和流程的新手。我正在开展一个个人项目,该项目使用随机森林分类器预测 NBA 比赛的获胜者。我有那么...

回答 1 投票 0

目标转换和特征选择。 ValueError:输入 X 包含 NaN

我在 scikit-learn 中使用 RFECV 进行特征选择。我想使用 log(y) 运行 XGBoost 模型,因为我已经能够证明它的性能比仅 y 更好。 简单的...

回答 1 投票 0


从递归特征消除(RFE)中提取最佳特征

我有一个由分类数据和数值数据组成的数据集,具有 124 个特征。为了降低其维度,我想删除不相关的特征。但是,要针对 fe 运行数据集...

回答 2 投票 0

尽管有标准化和交叉验证,模型性能仍面临挑战:使用汽车报废的 Automobile.tn 数据进行案例研究(1766 个条目)”

从sklearn.model_selection导入cross_val_score 从 sklearn. Linear_model 导入 LinearRegression 线性回归模型实例 线性模型 = 线性回归() 贴花...

回答 1 投票 0

Python Boruta 和 R Boruta 有区别吗?

我在 R 和 Python 中使用 Boruta 包来处理相同的数据集。我应用的所有步骤和其他方法都是相同的。但是 Boruta 在 Python 和 R 中的特征选择结果是不同的......

回答 2 投票 0

n_jobs=-1 未使用 100% CPU

我正在对大约 200 个特征使用顺序特征选择。我有 8 个物理核心(+8 个虚拟核心),作业数设置为 -1,但它仍然没有使用 100% 的 CPU 能力,而是使用 8%。我怎样才能...

回答 1 投票 0

为什么我的预处理器会出现数据类型错误?

我在为我的数据创建预处理器时遇到问题。我的预处理器包含一个数字特征管道,用于估算 NaN 和缩放值。它还具有用于分类数据的管道...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.