同时具有连续和分类特征的数据,如何进行特征选择?

问题描述 投票:-2回答:1

当我同时具有数值和分类特征时,如何进行特征选择?分割特征并分别探索相关性是否常见(例如,选择出我的分类特征并使用Chi-square,然后选择我的连续特征并使用ANOVA?

machine-learning feature-selection
1个回答
0
投票

一般来说--不是,如果你使用信息增益进行特征选择,首先需要通过离散化将你的连续属性转化为名义属性。一个属性的名义值的数量会极大地影响信息增益--因为你的名义值越多,解释目标变量的机会就越大。确保你的每个属性的值数大致相同,并且你使用的是信息增益比,它将信息增益与值数及其概率归一化。

© www.soinside.com 2019 - 2024. All rights reserved.