非结构化数据的文本分析

问题描述 投票:0回答:1

我有一个问题我确实有大量的非结构化文本数据,我想将其分类到不同的 - 不同的扇区。

我正在使用朴素贝叶斯分类器

现在,我的问题是我应该在Y中传递什么?因为我没有目标值

并根据语法我必须通过它。

mnb = MultinomialNB()

mnb.fit(X,y)

TypeError: fit() missing 1 required positional argument: 'y'

正如我所说,我没有目标价值。

我怎样才能做到这一点?

帮助将不胜感激

python classification naivebayes
1个回答
0
投票

朴素贝叶斯分类器是一种有监督的学习方法,需要您使用预先知道目标的标记数据进行训练。然后,您可以在未标记的数据上使用它来预测未来的值,但是您无法在没有目标值的数据上进行训练。

在不了解您的任务的情况下很难推荐不同的方法,但听起来您想要研究无监督的聚类算法。 k-means是一个相对简单的开始。

© www.soinside.com 2019 - 2024. All rights reserved.