feature-selection 相关问题

在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。

聚类的特征选择

Pandas中是否有设施可用于非监督性的聚类选择?例如,考虑我们正在使用KMeans算法,我们需要找到重要的功能。输入...

回答 1 投票 0

最重要的特征是高斯朴素贝叶斯分类器python sklearn

我正在尝试为我的GaussianNB模型获得最重要的功能。这里的代码如何获得scikit-learn分类器的大多数信息功能?或这里如何获得最有用的信息...

回答 1 投票 5

了解sklearn中CountVectorizer中的`ngram_range`参数

我对如何在Python的scikit-learn库中使用ngram感到有些困惑,特别是ngram_range参数在CountVectorizer中的工作方式。运行此代码:from sklearn ....

回答 2 投票 28

用于基准实验的学习者的特征重要性-mlr

我正在R中使用mlr包来比较两个学习者,即随机森林和套索分类器,执行二进制分类任务。我使用嵌套的交叉验证来计算性能。然后,我想...

回答 1 投票 0

如何在jupyter中解释和查看完整的置换特征图?

我正在尝试通过置换特征重要性图生成特征重要性图。我试图确定通过不同方法返回的功能是否稳定。 ...

回答 1 投票 1

如何使用置换特征重要性获取值

我有一个5K(和60个要素)记录的数据集,主要用于二进制分类。请注意,此解决方案在这里不起作用,我正在尝试使用置换生成特征重要性...

回答 1 投票 1

用于分类和回归的递归特征消除的模型

我们可以将哪些模型用于递归特征消除以进行分类和回归。例如,我们可以使用选择器= RFE(RandomForestClassifier(),5)进行分类,并使用选择器= ...

回答 1 投票 0

通过更改XGBClassifier的random_state更改模型性能

我针对分类问题训练了XGBClassifier,并使用optuna在巨大的网格上进行了超参数调整(可能调整了每个可能的参数)。在测试过程中,random_state的更改...

回答 2 投票 0

如何使用递归特征消除?

我是ML新手,一直在尝试使用RFE方法进行特征选择。我的数据集有5K条记录及其二进制分类问题。这是我根据教程所遵循的代码...

回答 1 投票 0

na.fail.default中的随机森林错误:对象中缺少值

我正在运行一个RF模型,该模型的大多数变量都没有错误;但是,当我包含一个变量:duration_in_program和以下代码时:```{r随机森林模型} ##运行随机...

回答 1 投票 0

如何处理在数据集中的多个列上应用一种热编码后产生的大量恐惧?

我正在从kaggle处理TMDB 5000电影数据集:https://www.kaggle.com/tmdb/tmdb-movie-metadata在预处理阶段,我使用MultiLabelBinarizer()来编码数据集中的列...

回答 2 投票 0

如何将随机森林与大熊猫一起使用特征重要性?

我是新来的。我很高兴知道您对我的问题的建议。我需要知道数据集中哪些功能最重要。因此,我使用了SelectFromModel(RandomForestClassifier(...

回答 1 投票 1

我们可以同时执行特征选择和PCA吗?

同时执行特征选择和PCA是否有问题?>

回答 1 投票 0

从OneHotEncoder获得相应的功能

[我尝试使用OneHotEncoder转换特征后对数据集中的某些特征进行数据分析,并且输出显示特征13和特征21是最重要的...

回答 1 投票 0

不同的数据类型会影响特征选择算法的规范化

假设我们的数据集有1000个数据(矩阵行)和700个要素(矩阵列)。我想运行各种类型的特征选择算法以找到最佳特征。此数据集的特征是...

回答 1 投票 0

svm-rfe在不同级别的功能上

让我们假设我有1000个要素的数据。我想对此数据应用SVM-RFE,每次删除10%的功能。总体上如何获得准确度...

回答 1 投票 -1

神经网络混合实值和分类输入特征

我的问题包括三个部分:(1)前馈神经网络可以处理混合的输入特征吗?有些是分类的(离散值:例如,低,中,高),有些是实值的?总数...

回答 1 投票 0

R如何滞后4000列50次

我有一个包含4000列的数据框,并且按时间对每日观察进行排序。我想创建新列,使其过去的所有现有列滞后50次。因此,对于Y列,请另外创建50个...

回答 1 投票 2

SciKit-Learn标签编码器,导致错误'参数必须是字符串或数字'

我有点困惑-在这里创建ML模型。我正在尝试从“大”数据框(180列)中获取分类特征并对其进行一次热分析,以便可以找到...

回答 1 投票 1

RFECV机器学习功能选择花费的时间太长Python

我对SKLearn还是比较陌生,对功能选择有疑问。我正在尝试建立一个SVM模型,我的数据具有大约30个特征,全部约1万个数据点,而我目前正在...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.