我读到,建议使用 feature selection
之后 feature extraction
进程。
但在我读到的所有帖子中,都缺少一些东西。
假设我们有50个特征
假设我们使用特征提取,我们得到了3个新的提取特征。
2个问题。
我们是否需要运行 feature selection
上。
或
假设我们对特征提取的结果进行特征选择,但并不是所有新提取的特征都被特征选择算法所选择(即3个特征中的2个),如果我们可以放弃一个 "新 "维度,似乎特征提取的输出不够好?
我们在完整的原始特征集上运行 feature_selection 来选择最有用的特征。
如果你使用维度降低来找到3个额外的特征,那么你的特征集将由所有53个特征组成,因此你将在53个特征上运行特征选择。
这看起来更像是一个陈述而不是一个问题。如果你的意思是 我们可以用少1个特征重新运行特征提取(维度降低),因为其中一个特征不重要。不,你不能做这样的假设,认为用2个特征重新运行提取就能保证两个特征都被选中。 这要看使用的是什么维度降低技术,特征选择方案是什么,数据集等。