我一直在为我正在从事的项目尝试学习一些机器学习。目前,我设法使用SVM对文本进行了分类,其中sklearn和spacy具有不错的效果,但我不仅希望对文本进行分类使用svm,我也希望根据我拥有的关键字列表对其进行分类。例如:如果句子中有快速或秒这个词,我希望将其归类为性能。
我真的是机器学习的新手,我将不胜感激任何建议。
我假设您已经获取了一部分数据,对其进行了手动分类,然后将结果用作SVM算法的训练数据。
[如果是,那么您可以将关键字(功能)列表和所需分类(标签)添加到训练数据中。如果您尚未这样做,建议您在训练数据功能上使用SnowballStemmer。