是一个热门编码是免费的虚拟陷阱[关闭]

问题描述 投票:-3回答:1

在一个热编码器中有一个叫做虚拟陷阱的东西,当我们用3个类别对分类列进行编码,以免说a,b和c然后用一个热编码器我们得到3个类别或者列a,b和c但是当我们使用get_dummies我们得到2列而不是a,然后b从虚拟陷阱中保存。是一个暴露于虚拟陷阱的热门编码或它负责它。我对吗?哪一个是假陷阱?或者可以同时使用我们的删除列,我使用数据集进行许多算法。

寻求帮助。提前致谢。

machine-learning deep-learning bigdata data-science
1个回答
0
投票

OneHotEncoder无法直接处理字符串值。如果您的名义特征是字符串,那么您需要首先将它们映射为整数。

pandas.get_dummies恰恰相反。默认情况下,除非指定了列,否则它仅将字符串列转换为单热表示。

© www.soinside.com 2019 - 2024. All rights reserved.