在机器学习中,这是选择最相关特征的子集来构建数据模型的过程。
我有一个数据集(包括类在内的31个特征)。这个数据集即将被用于一个分类问题。我想用Pearson相关来检查特征之间的相关性 ...
我正在训练一个机器学习模型,它把图像作为输入负责分类,我存储图像像素的数组,但我发现在互联网上,图像可以存储在2-D ... ...
我用lightgbm来表示特征的重要性 然而,输出的是一些度量的情节分数。我的问题是。X轴上的指标是什么? 是F-score还是其他什么?我怎样才能...
如何使用xgboost在选择特征数量少的情况下获得最高精度?
我一直在寻找几种特征选择方法,从下面的链接(XGBoost特征重要性和选择)找到了关于XGBoost帮助下的特征选择。我实现了...
我使用的是来自SciKit的确切例子,它将permutation_importances与树特征_importances进行比较 你可以看到,使用了一个Pipeline: rf = Pipeline([ ('preprocess', preprocessing), ...
Weka异常。Train and test file not compatible!"抛出,尽管有过滤器可以纠正这种不兼容的情况
假设我有以下ARFF格式的数据。TRAIN: @ATTRIBUTE A NUMERIC @ATTRIBUTE B NUMERIC @ATTRIBUTE C NUMERIC TEST @ATTRIBUTE ID NUMERIC @ATTRIBUTE A NUMERIC @ATTRIBUTE B NUMERIC @...。
当我同时拥有数值和分类特征时,如何进行特征选择?分割特征并分别探索相关性是否常见(例如,选择出我的分类......)?
我目前正在研究蛋白质的二元分类问题。我们的目标是弄清楚一个突变是否会改变蛋白质的功能,从活性到非活性。这个突变可以...
我打印了我的SVM模型在二元分类上预测的分类报告,但它在第一次预测时得分很高(超过95%),我知道它打印高值时很好,但我需要...
我有一个数据框,如下图,所有XX YY ZZ变量的行号都是一样的,在这里输入图像描述如何转换成日期XX YY ZZ 0120 69 450 1000 0220 ......
[嗨,我是python新手,如果问题不清楚,请告诉我。这是我的数据框:df = pd.DataFrame(df_test)年龄bmi儿童收费0 19 27.900 0 16884.92400 ...
什么是“ neg_mean_absolute_error”,在哪里可以找到它?
我是机器学习的新手。我正在尝试从此链接学习功能选择。在这里,他们有一行代码,如下所示:search = GridSearchCV(pipeline,grid,scoring ='...
我需要基于粗集来实现特征选择的快速归约算法,为此,我使用了癌症乳腺癌数据集,即使代码运行结果为假,也会出现一些错误(...
具有L1正则Logistic回归的Sklearn SelectFromModel
作为我的管道的一部分,我希望结合使用LogisticRegression(penalty ='l1')和SelectFromModel进行特征选择。为了选择合适的正则化量,我优化了...
[术语:组件:PC loading-score [i,j]:PC [i]中的j功能问题:我知道有关功能选择的问题在StackOverflow(SO)和其他位置多次被问到了...] >
sklearn Pipeline:类型'ColumnTransformer'的参数不可迭代
我正在尝试使用管道来提供整体投票分类器,因为我希望整体学习者使用针对不同功能集训练的模型。为此,我遵循了教程...
我们正在完成一项有关文本分类的任务,我们使用了一种无监督的机器学习模型。在进行文本聚类之前,数据集必须经过几个步骤...
当Logistic回归中特征系数的符号发生变化时,如何决定/解释特征系数的结果?
我有一个Logistic回归模型。大约有10个功能,其中3个基本上是高度相关的(我们称它们为x_5,x_6,x_7)。实际上x_5 + x_6 = x_7。但是它们都是很重要的...
我们可以使用for循环吗?如果在向后消除中使用它,可以轻松地做到这一点,而不是一一做到?导入statsmodels.formula.api作为sm X = np.append(arr = np.ones((50,1))。astype(int),values = X,...