feature-selection 相关问题

在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。

当特征不相关时,皮尔逊相关说明了什么?

我有一个数据集(包括类在内的31个特征)。这个数据集即将被用于一个分类问题。我想用Pearson相关来检查特征之间的相关性 ...

回答 1 投票 0

图像像素可以存储在1 D数组中吗?

我正在训练一个机器学习模型,它把图像作为输入负责分类,我存储图像像素的数组,但我发现在互联网上,图像可以存储在2-D ... ...

回答 1 投票 0

如何获得lightgbm模型的特征方差解释?

我用lightgbm来表示特征的重要性 然而,输出的是一些度量的情节分数。我的问题是。X轴上的指标是什么? 是F-score还是其他什么?我怎样才能...

回答 1 投票 0

如何使用xgboost在选择特征数量少的情况下获得最高精度?

我一直在寻找几种特征选择方法,从下面的链接(XGBoost特征重要性和选择)找到了关于XGBoost帮助下的特征选择。我实现了...

回答 1 投票 0

使用SciKit中的管道进行排列重要性分析。

我使用的是来自SciKit的确切例子,它将permutation_importances与树特征_importances进行比较 你可以看到,使用了一个Pipeline: rf = Pipeline([ ('preprocess', preprocessing), ...

回答 1 投票 0

Weka异常。Train and test file not compatible!"抛出,尽管有过滤器可以纠正这种不兼容的情况

假设我有以下ARFF格式的数据。TRAIN: @ATTRIBUTE A NUMERIC @ATTRIBUTE B NUMERIC @ATTRIBUTE C NUMERIC TEST @ATTRIBUTE ID NUMERIC @ATTRIBUTE A NUMERIC @ATTRIBUTE B NUMERIC @...。

回答 1 投票 0

同时具有连续和分类特征的数据,如何进行特征选择?

当我同时拥有数值和分类特征时,如何进行特征选择?分割特征并分别探索相关性是否常见(例如,选择出我的分类......)?

回答 1 投票 -2

二进制分类与charstring特征

我目前正在研究蛋白质的二元分类问题。我们的目标是弄清楚一个突变是否会改变蛋白质的功能,从活性到非活性。这个突变可以...

回答 1 投票 0

第一次预测的精度、F-score和召回率都很高

我打印了我的SVM模型在二元分类上预测的分类报告,但它在第一次预测时得分很高(超过95%),我知道它打印高值时很好,但我需要...

回答 1 投票 0

如何将观测值拆叠并按列排列[重复]

我有一个数据框,如下图,所有XX YY ZZ变量的行号都是一样的,在这里输入图像描述如何转换成日期XX YY ZZ 0120 69 450 1000 0220 ......

回答 1 投票 0

如何将数据框添加到具有较高特征得分的选定列中

[嗨,我是python新手,如果问题不清楚,请告诉我。这是我的数据框:df = pd.DataFrame(df_test)年龄bmi儿童收费0 19 27.900 0 16884.92400 ...

回答 2 投票 1

什么是“ neg_mean_absolute_error”,在哪里可以找到它?

我是机器学习的新手。我正在尝试从此链接学习功能选择。在这里,他们有一行代码,如下所示:search = GridSearchCV(pipeline,grid,scoring ='...

回答 1 投票 -1

粗糙集:Python中的快速精简/功能选择

我需要基于粗集来实现特征选择的快速归约算法,为此,我使用了癌症乳腺癌数据集,即使代码运行结果为假,也会出现一些错误(...

回答 1 投票 2


具有L1正则Logistic回归的Sklearn SelectFromModel

作为我的管道的一部分,我希望结合使用LogisticRegression(penalty ='l1')和SelectFromModel进行特征选择。为了选择合适的正则化量,我优化了...

回答 1 投票 0

使用PCA(讨论)的最佳特征选择方法

[术语:组件:PC loading-score [i,j]:PC [i]中的j功能问题:我知道有关功能选择的问题在StackOverflow(SO)和其他位置多次被问到了...] >

回答 1 投票 0

sklearn Pipeline:类型'ColumnTransformer'的参数不可迭代

我正在尝试使用管道来提供整体投票分类器,因为我希望整体学习者使用针对不同功能集训练的模型。为此,我遵循了教程...

回答 1 投票 0

特征选择文本挖掘

我们正在完成一项有关文本分类的任务,我们使用了一种无监督的机器学习模型。在进行文本聚类之前,数据集必须经过几个步骤...

回答 4 投票 0

当Logistic回归中特征系数的符号发生变化时,如何决定/解释特征系数的结果?

我有一个Logistic回归模型。大约有10个功能,其中3个基本上是高度相关的(我们称它们为x_5,x_6,x_7)。实际上x_5 + x_6 = x_7。但是它们都是很重要的...

回答 1 投票 0

python中的向后消除

我们可以使用for循环吗?如果在向后消除中使用它,可以轻松地做到这一点,而不是一一做到?导入statsmodels.formula.api作为sm X = np.append(arr = np.ones((50,1))。astype(int),values = X,...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.