为连续特征、多个标签选择朴素贝叶斯模型

问题描述 投票:0回答:1

想象我有一个数据集,其特征值是连续的,并且有两个以上可能的标签(例如:下雨、晴天、刮风等),我应该在sklearn中实现哪种朴素贝叶斯模型?

我正在考虑高斯或多项式。然而,多项式适用于离散特征,我尝试了高斯,但结果证明预测的准确性就像随机选择一样。

python machine-learning scikit-learn naivebayes
1个回答
0
投票

朴素贝叶斯分类 (NBC) 适用于离散值。 这意味着您必须离散化所有连续的特征。有关更多详细信息,这可能会有所帮助

无论如何,多项式是正确的,因为你有多个标签。但您还应该记住,您必须对标签进行 one-hot 编码(sklearn 中的 OneHotEncoder)。

© www.soinside.com 2019 - 2024. All rights reserved.