我不是数据科学家,也不是数据科学/机器学习的新手。我的目标是预测某些文本是否属于特定类。我看起来很天真的海湾来分类不同类的文本,但在这里我只有一个类。最后,我想预测文本是否属于某个类(例如,如果文本的类型为technical
,而不是文本是technical
或political
)。我只有积极的数据集(technical
类型的所有文本)用于训练。
据我所知,Naive海湾将需要培训的正数据集和负数据集。不确定这是否是此处用于解决问题的最佳算法。如果有的话,想学习更好的方法。谢谢。
您有两种选择: