我正在尝试通过在二进制文本分类(做运动,不做运动)的文本响应中查找运动术语来标记来创建自定义 NER。这是这样做的正确方法吗?
2 个自定义 NER 标签是 (运动 - 健身房、tabata、OHP...等) (非运动 - 用于去健身房,用于跑步) A。在理解“健身房”在“曾经去健身房”和文本的双重标签(“运动”和“非运动”)中的标签时,是否会发生冲突?
b。一些不包含任何运动术语的文本将不得不被归类为不做运动(如果该文本没有 NER 标签但是这些文本有一个预训练的“不做运动”类别,那么文本分类器模型检测到这一点并预测“不做运动”?
我尝试使用来自 spacy(3.5 版)的文本分类器模型(spacy.TextCatBOW.v2)。但只给我<50%. Thus, I thought of creating a custom NER for identifing the terms required for the text categorizer.
的分数