决策树分类器将浮点值视为数字数据,但需要成为一种热编码数据类型

问题描述 投票:0回答:1

我正在对图片中的数据运行决策树分类器。在图片中,您可以看到时间签名和签名密钥等类型的数据需要用 1 和 0 进行热编码。但是,在数据框中,所有 0 和 1 都是浮点类型。因此,我的决策树分类器无法区分某个特征是否存在,但如果某个特征有用则使用 0.5 进行分类,如第二张图片所示。如何解决这个问题?

已经提前谢谢了

我已经尝试过将所有浮点数转换为整数,但并没有完全弄清楚如何

python pandas dataframe one-hot-encoding decisiontreeclassifier
1个回答
0
投票

决策树不会通过检查特征是否存在来进行分类。 树中使用的二进制值应使用某个阈值(例如 0.5)分隔,这样,1 将在一侧,0 将在另一侧。

这就是树的运行方式,没有bug。

这里是关于分类决策树的StatQuest: https://www.youtube.com/watch?v=_L39rN6gz7Y

© www.soinside.com 2019 - 2024. All rights reserved.