我正在处理仅具有仅两个值的类别变量/特征的不同数据集,例如(temperature ='low'and'high')或(light ='on'and 'off'或'0'和'1')。
我不确定是否要使用“ one-hot编码”]]或“ Label Encoding”方法来训练我的模型。我正在研究分类问题,并使用一些监督的机器学习算法。
我使用了“ Label Encoding”
,我得到了很好的结果。我觉得可能我做错了什么。我不确定是否应该使用“ one-hot encoding”。对于分类变量只有两个值
我应该使用哪种方法转换变量?我正在处理仅具有类别变量/特征且只有两个值的不同数据集,例如(温度='低'和'高')或(光='开'和'关'或'0'和'1 ')。我不是...
由于通常的问题,在少数情况下LabelEncoder很有用。如果您的分类特征是序数,则使用LabelEncoder,否则使用One-hot编码。但是,一键式编码会增加尺寸。在这种情况下,我通常采用One-hot编码,然后使用PCA进行降维。