feature-selection 相关问题

在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。

解释特征交互与特征相关

我对机器学习范式中提到的术语感到困惑吗?任何人都可以在这里放弃某种回应吗?我将感谢您。.

回答 1 投票 0

如何在R中的大型数据集(15GB)上运行监督的ML模型?

我有一个数据集(15 GB):7200万条记录和26个功能。我想比较7个监督的ML模型(分类问题):SVM,随机森林,决策树,朴素贝叶斯,ANN,KNN和...

回答 1 投票 0

机器学习中的更多复杂功能:泰坦尼克号数据集

我正在研究“机器学习”。特别是,我正在查看泰坦尼克号数据集。假设我们可以按姓氏来识别家庭...我想,这是最好的预测变量之一,其中...

回答 1 投票 -2

多变量时间序列分类中的特征选择

我有一个带有9个变量的时间序列数据。我发现其中有4个功能。例如,我计算np.mean(),np.std(),np.var(),np.ptp()现在,我的列从9个变量扩展到36个变量。 ...

回答 1 投票 0

特征与R之间的相关性

我想计算特征的相关性,每个特征都包含一个 的矩阵。 我的问题是如何使用R计算要素之间的相关性,而不是矩阵内部列的相关性。 ...

回答 0 投票 0

ScikitLearn:FeatureUnion返回熊猫数据框,但也是并行的

我第一次建立特征转换管道,但是注意到使用FeatureUnion将管道组合在一起会返回一个numpy数组,但是我更愿意返回一个熊猫...

回答 1 投票 0

LinearSVC功能选择在Python中返回不同的coef _

我在训练数据集上使用带有LinearSVC的SelectFromModel。训练和测试集已经拆分,并保存在单独的文件中。当我将LinearSVC放在训练集上时,我...

回答 1 投票 0

scikit-learn中的目标转换和特征选择

我正在使用RFECV在scikit-learn中进行功能选择。我想将简单线性模型(X,y)的结果与对数转换模型(使用X,log(y))的结果进行比较。简单模型:RFECV ...

回答 2 投票 3

虚拟变量的特征消除

我有几个类别变量,它们的类数量很高。我使用一热编码将其转换为1-0格式。原始:column_1 column_2 0.8 X 0.3 ...

回答 1 投票 0

tsfresh select_features方法背后的算法

我最近开始使用tsfresh库从时间序列数据中提取要素。我可以用几行代码来获得功能包,这很酷,但是我对...

回答 1 投票 0

为什么在应用选定特征时,诸如准确性和F1之类的预测指标没有改善?

我正在通过监督方法使用MLR包构建模型。我执行的步骤是1)清理数据2)应用的特征选择(基于相关的特征选择)3)...

回答 1 投票 0

如何获得顶部的二元分类问题的影响因素

我有一个二元分类问题,约30的功能和最终的合格/不合格标签。我第一次训练的分类,以便能够预测,如果新的实例将通过或失败,但现在我想...

回答 1 投票 0

确定哪些功能下降/选择使用GridSearch scikit学习

一个人如何确定哪些功能/列/属性中使用GridSearch成绩下降?换句话说,如果GridSearch返回max_features应该是3,我们能确定它的确切3个功能...

回答 2 投票 0

我怎么能retrive其影响结果Python中的数据集的属性

我是一个初学者。我做的GPA的预测。我的数据集有像学生的旅行时间,学习时间,父母的职业,他们的成绩,母亲的职业变量我etc.how可以检索...

回答 2 投票 -2

为特征选择穷举搜索网

我一直在与几个分级特征选择的方法。正如你可能知道,这些类型的算法,根据一些具体的方法均居功能(例如,统计,稀疏学习,...

回答 2 投票 2

生成与R中随机选择的特征数据集的列表

我有20个特征的数据集。我希望创建与原始数据集的功能子集随机数据集列表。例如 - [数据集[,C(1,3,4)],数据集[,C(2,3,5,11,20)〕〕。我是 ...

回答 1 投票 1

在Scikit Learn中运行SelectKBest后获取功能名称的最简单方法

我想进行有监督的学习。到现在为止,我知道要对所有功能进行监督学习。但是,我还想进行K最佳功能的实验。我看了......

回答 4 投票 28

将潜在空间的特征重要性与正常空间相关联

我有一个大的(形状是(3000,25000))矩阵,我已经使用t-SNE / UMAP减少到(3000,2)表示,并且已经看到分类性能的显着提高...

回答 1 投票 0

ChiSqSelector选择了错误的功能?

我从Spark 2.3.0 Shell的文档中复制粘贴了这个例子。 import org.apache.spark.ml.feature.ChiSqSelector import org.apache.spark.ml.linalg.Vectors val data = Seq((7,Vectors.dense(0.0,...)

回答 1 投票 1

在我的Xgboost机器学习模型中,当功能具有0重要性时,您应该丢弃它们还是将它们组合在一起?

我一直在尝试构建一个ML模型,它预测不同产品通过部署管道所需的时间。我创造了大约30-40种不同的功能,其中90%是......

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.