feature-selection 相关问题

在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。

Pyspark更新特征向量中的值

我正在构建文本分类器,并使用spark countVectorizer来创建特征向量。现在要将此Vector与BIDGL库一起使用,我需要将特征向量中的所有0转换为1.这是我的......

回答 1 投票 0

使用mutual_info回归进行要素选择时重塑错误

我正在尝试使用带有SelectKBest包装器的mutual_info_regression进行一些功能选择。但是我一直遇到一个错误,表明我的功能列表需要重新整形为2D ...

回答 1 投票 0

从MLSeq R包中提取分类器

我目前对R来说是个新手,并且无法从包中提取我想要的信息。我正在使用MLSeq在RNA Seq数据上实现随机森林,以找到...的生物标记

回答 1 投票 0

选择KBest不会产生适当的结果

我正在尝试为我的数据集进行特征选择。删除不需要的变量后,它只包含数字和分类变量。代码如下。 selector = SelectKBest(score_func = chi2,...

回答 1 投票 0

使用scikit-learn按顺序排列所有功能

我正在尝试使用scikit-learn f_regression和SelectKBest对所有功能进行排序。如果排序特征k的数量小于特征总数n,则该方法很有效。 ...

回答 2 投票 1

Python中的RReliefF特性选择

是否有可用的Python包,它实现了回归目标的RReliefF功能选择? ReliefF和RReliefF的理论和实证分析https://link.springer.com / ...

回答 1 投票 0

获取功能名称形式selectKbest

我使用Scikit学习selectKbest来选择最好的功能,其中大约500个来自900。如下所示,其中d是所有特征的数据帧。来自sklearn.feature_selection import SelectKBest,...

回答 2 投票 1

Bag of Words(BOW)vs N-gram(sklearn CountVectorizer) - 文本文档分类

据我所知,在Bag Of Words方法中,功能是一组单词及其在文档中的频率计数。另一方面,N-gram,例如unigrams完全相同,但它没有......

回答 1 投票 0

keras模型上的特征选择

我试图找到支持我的回归模型输出的最佳功能,以下是我的代码。 seed = 7 np.random.seed(seed)estimators = [] estimators.append(('mlp',...

回答 2 投票 2

使用chi2测试进行连续特征选择(Scikit Learn)

我试图从许多连续特征中预测二元(分类)目标,并希望在进入模型拟合之前缩小特征空间。我注意到SelectKBest类......

回答 2 投票 2

如何实现分类变量的特征选择?

我在选择重要功能时遇到问题。数据集的功能是分类和数字。目标变量为False或True。数据集的功能大约是100,所以我......

回答 1 投票 0

功能标志 - 它们是否应该暴露给客户端应用程序?

我正在考虑在基于网络的应用程序中使用功能标志,该应用程序同时具有javascript / html和移动本机客户端,并且我正在尝试对以下内容做出明智的决定:功能标志应该是......

回答 1 投票 3

为什么(rf)clf feature_importance重视所有值相同的功能?

我在scikit-learn中比较多分类与随机森林和CART。我的两个功能(功能4和功能6)与分类无关,因为所有值都是......

回答 1 投票 0

sklearn使用f_classif并选择分数高于阈值的要素

我使用f_classif来确定我的特征分数:def select_feature_anova(x,y,data):anova = feature_selection.f_classif(x,y)threshold = 10#如何构建x_new?是什么 ...

回答 1 投票 1

XGBoost - 国家特征应该标记还是一个热编码?

我们的模型中有一个国家的特征,我们正在使用标签编码器,例如:BEL - 1,US - 2,ENG - 3等...... XGBoost模型的最佳实践是什么 - 使用它作为数字......

回答 1 投票 0

表示机器学习中的价值预测模型的特征是什么是表示时刻和星期几的最佳方式?

在机器学习中使用特征并在矩阵中表示它们时,建议使用什么方法来表示一天中的小时和星期几作为值预测模型的特征?正在使用......

回答 2 投票 -1

哪个是自动编码器的更好输入,一个具有相关功能或一个具有不相关的功能?

我试图在2D中可视化我的数据以检测欺诈(异常值),我的所有功能都可能在欺诈的情况下采取更大的价值。但我小心不要包含多余的功能,......

回答 1 投票 1

用于持续交付的功能标志解决方案

我正在构建一个具有2周冲刺周期的应用程序。我们目前一次测试功能推出,然后如果出现问题则测试热补丁。我们的堆栈是带有角度和mongo的节点。任何人 ...

回答 2 投票 3

使用字符串/分类特征(变量)进行线性回归分析?

回归算法似乎正在处理以数字表示的特征。例如:此数据集不包含分类要素/变量。很清楚如何对此进行回归......

回答 3 投票 29

KNA的PCA:插入符号中的预处理参数

我正在对我的数据进行知识回归,并希望:a)通过重复cc交叉验证以找到最佳k; b)在构建knn模型时,使用PCA在90%的水平阈值下减少......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.