因变量的一个编码器热

问题描述 投票:0回答:2

我是新来machine learning我的问题是:

我们是否需要编码一个因变量y,如果它包含三个班段1,2,3,我想知道是否有需要因变量进行编码时它不包含任何

python machine-learning
2个回答
0
投票

OneHotEncoder将创建列k号码,如果有k类的单一变量。

例如:它会创建2变量,如果在数据集中的性别值Male/Female,它将创建3变量如果性别值male/Female/PreferNotToSay

现在,你不想在你的谓词y多个变量,因此,更好地与LabelEncoder(从sklearn.preprocessing)或一些保持完好的维机制去。


0
投票

我没有明确得到什么因变量在你的情况。

  1. 如果你在谈论“Y”的输出,那么没有必要一个热编码。
  2. 如果一个特定的列是组合/依赖于任何其他列。在机器学习,一列有另一个之间的一些或其他关系。
  3. 更好地做到对分类变量的一个热码。

下面是一个什么热做编码的例子:

之前:

name gender
a     M
b     F
c     O

name M F O
a    1 0 0
b    0 1 0
c    0 0 1
© www.soinside.com 2019 - 2024. All rights reserved.