关于onehotencoder空间成本

问题描述 投票:0回答:1

为什么onehotencoding不使用基于位的编码?占用的内存不是少很多吗?我的意思是,当您对四个城市进行编码时,您可以像 onehotencoder 那样将一列扩展到 4 或在一列中这样进行:

    1st city = 0(base10) = 00000000
    2nd city = 1(base10) = 00000001
    3rd city = 2(base10) = 00000010
    4th city = 3(base10) = 00000011    

。 就内存成本而言,这不是更有效吗?还是编码技术迫使它占用更多空间?

python machine-learning encoding artificial-intelligence one-hot-encoding
1个回答
0
投票

根据this答案,使用基于位的编码,现在第二个城市和第四个城市共享特征x0,第三个城市和第四个城市共享特征x1,这会影响我们的预测。

© www.soinside.com 2019 - 2024. All rights reserved.