用于简短描述的名称、实体、产品、地点识别的预训练模型(Spacy、NLTK 等)

问题描述 投票:0回答:1

我的描述非常简短,不超过 40 个字符。我使用 Spacy 的 NER 模型来识别名称、实体、产品和食品。 我的文字描述的问题是非常短并且不是正确的英语句子。 Spacy 无法识别名称、实体、产品和食品并返回空值。

例如,我表格中的第一个描述是“Monster Ultra Strawberry”。但是当我尝试获取单个标记的实体类型标签时,spacy 模型返回 null。

我的代码如下。

nlp = spacy.load('en_core_web_lg')

    docs = nlp(data['desc'][0])
    for token in docs:
        print(token.ent_type_)

请告诉我在这种情况下我还可以使用哪些其他型号?是否有模型分类器可以将单词分类到这些存储桶中 - 名称、组织、食品、产品等,而无需额外的上下文?

python nlp nltk spacy
1个回答
0
投票

您可以在此处查看 spaCy en_core_web_lg 支持的实体列表:https://spacy.io/models/en,我在列表中没有看到名称、实体或食物。您可以进一步训练任何 spaCy 模型来识别您正在寻找的特定实体。

您还可以创建与要识别的实体相关的关键字列表,然后使用字符串匹配技术来识别这些关键字,因为您的句子中没有上下文信息。虽然这不像 NER 那么复杂,但如果您的词汇量有限,它可以很好地发挥作用。

© www.soinside.com 2019 - 2024. All rights reserved.