只有两个值的分类变量

问题描述 投票:0回答:1

我正在处理仅具有仅两个值的类别变量/特征的不同数据集,例如(temperature ='low'and'high')或(light ='on'and 'off'或'0'和'1')。

我不确定是否要使用“ one-hot编码”]]或“ Label Encoding”方法来训练我的模型。我正在研究分类问题,并使用一些监督的机器学习算法。

我使用了“ Label Encoding”

,我得到了很好的结果。我觉得可能我做错了什么。我不确定是否应该使用“ one-hot encoding”

对于分类变量只有两个值

我应该使用哪种方法转换变量?

我正在处理仅具有类别变量/特征且只有两个值的不同数据集,例如(温度='低'和'高')或(光='开'和'关'或'0'和'1 ')。我不是...

python-3.x encoding categorical-data one-hot-encoding labeling
1个回答
0
投票

由于通常的问题,在少数情况下LabelEncoder很有用。如果您的分类特征是序数,则使用LabelEncoder,否则使用One-hot编码。但是,一键式编码会增加尺寸。在这种情况下,我通常采用One-hot编码,然后使用PCA进行降维。

© www.soinside.com 2019 - 2024. All rights reserved.