feature-selection 相关问题

在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。

有没有办法在模型拟合后检索 SequentialFeatureSelection 的系数?

我正在尝试进行特征选择,以识别与响应相关的特征。到目前为止,我已经使用了 sklearn 中的 RFE、RFECV、SelectFromModel 和 SequentialFeatureSelection。莫之后...

回答 1 投票 0

使用 SelectKBest 从 3D numpy 数组中自动选择特征

我是机器学习新手,正在处理一个非常复杂的问题。我有一个名为“psd_data”的 3D numpy 数组,其中包含来自执行运动想象三项的人类受试者的脑电图数据...

回答 2 投票 0

如何在 R XGboost 中找到每个预测的重要变量

我将 xgboost 应用于以下数据集并进行预测,我也能够获得整个模型最重要的特征,但是我也想知道每个预测...

回答 1 投票 0

在 scikit-learn 和 PCA 中使用向后特征选择进行特征选择

我已经使用 PCA 计算了 DF 中所有列的分数,该 DF 有 312 列和 650 行,代码如下: all_pca=PCA(random_state=4) all_pca.fit(tt) all_pca2=all_pca.transform(tt...

回答 1 投票 0

Okapi BM25在python中的实现

我正在尝试用Python实现Okapi BM25。虽然我看过一些教程如何做到这一点,但我似乎陷入了这个过程。 所以我收集了文档(并且有“id”和“t”列......

回答 3 投票 0

使用 RFECV 和排列重要性的正确方法 - Sklearn

Sklearn #15075 中有一个实现这一点的提案,但与此同时,建议使用 eli5 作为解决方案。但是,我不确定我是否以正确的方式使用它。这是我的代码: 来自 sklearn.dat...

回答 2 投票 0

WEKA凯姆套餐

在网络搜索上找不到任何用于 CAIM 离散化的 WEKA 包。我需要 WEKA v3 的软件包。 在谷歌上搜索 WEKA 包,但没有找到任何包,尽管有些文档说它存在。 谁都可以吗

回答 1 投票 0

随机森林分类器使用Top-N特征方法去除特征

我是数据科学和机器学习技术和流程的新手。我正在开展一个个人项目,该项目使用随机森林分类器预测 NBA 比赛的获胜者。我有那么...

回答 1 投票 0

目标转换和特征选择。 ValueError:输入 X 包含 NaN

我在 scikit-learn 中使用 RFECV 进行特征选择。我想使用 log(y) 运行 XGBoost 模型,因为我已经能够证明它的性能比仅 y 更好。 简单的...

回答 1 投票 0


从递归特征消除(RFE)中提取最佳特征

我有一个由分类数据和数值数据组成的数据集,具有 124 个特征。为了降低其维度,我想删除不相关的特征。但是,要针对 fe 运行数据集...

回答 2 投票 0

尽管有标准化和交叉验证,模型性能仍面临挑战:使用汽车报废的 Automobile.tn 数据进行案例研究(1766 个条目)”

从sklearn.model_selection导入cross_val_score 从 sklearn. Linear_model 导入 LinearRegression 线性回归模型实例 线性模型 = 线性回归() 贴花...

回答 1 投票 0

Python Boruta 和 R Boruta 有区别吗?

我在 R 和 Python 中使用 Boruta 包来处理相同的数据集。我应用的所有步骤和其他方法都是相同的。但是 Boruta 在 Python 和 R 中的特征选择结果是不同的......

回答 2 投票 0

n_jobs=-1 未使用 100% CPU

我正在对大约 200 个特征使用顺序特征选择。我有 8 个物理核心(+8 个虚拟核心),作业数设置为 -1,但它仍然没有使用 100% 的 CPU 能力,而是使用 8%。我怎样才能...

回答 1 投票 0

为什么我的预处理器会出现数据类型错误?

我在为我的数据创建预处理器时遇到问题。我的预处理器包含一个数字特征管道,用于估算 NaN 和缩放值。它还具有用于分类数据的管道...

回答 1 投票 0

特征选择还是降维?

如果我有来自两个深度学习模型的两个特征向量(第一个是1280,第二个是1050),哪种方法可以更好地减少这些向量的维度?功能选择...

回答 1 投票 0

客户流失模型中的目标泄漏

我正在研究客户流失模型,我有一些疑问要确认是否由于某些功能而存在目标泄漏。请查找以下详细信息: 客户群:截止至 22 日

回答 1 投票 0

varImp 函数,插入符包 R,返回非树模型的错误: y -mean(y, rm.na = TRUE) 中的错误:二元运算符的非数字参数

我通过 R 中的 caret 包创建了六个模型。其中两个模型,一个 SVM 和一个 pcaNN,表现良好,我想看看它们对特征的排名与一个模型有何不同......

回答 1 投票 0

将前向特征选择与 KNN 结合时出现 InvalidIndexError: (slice(None, None, None), [0])

我正在尝试使用 uci 心脏病数据集来预测心脏病。我正在应用前向特征选择技术来选择特征,然后应用 knn 进行预测。附上c...

回答 1 投票 0

如何手动选择 Scikit-Learn 模型回归的特征

这是一个非常简单的问题,所以我希望得到一个简单的答案。我怀疑我错过了一些明显的东西...... 在 Scikit-learn 中,有多种方法可以进行自动特征选择。 例如。

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.