我有一个问题我确实有大量的非结构化文本数据,我想将其分类到不同的 - 不同的扇区。
我正在使用朴素贝叶斯分类器
现在,我的问题是我应该在Y中传递什么?因为我没有目标值
并根据语法我必须通过它。
mnb = MultinomialNB()
mnb.fit(X,y)
TypeError: fit() missing 1 required positional argument: 'y'
正如我所说,我没有目标价值。
我怎样才能做到这一点?
帮助将不胜感激
朴素贝叶斯分类器是一种有监督的学习方法,需要您使用预先知道目标的标记数据进行训练。然后,您可以在未标记的数据上使用它来预测未来的值,但是您无法在没有目标值的数据上进行训练。
在不了解您的任务的情况下很难推荐不同的方法,但听起来您想要研究无监督的聚类算法。 k-means是一个相对简单的开始。