使用spacy或nltk从德语文本数据中提取人名?

问题描述 投票:0回答:1

我正在使用德语的spacy模型来提取命名实体,例如位置名称,人员名称和公司名称,但没有得到正确的结果作为输出。是否有我无法精确找出的缺失概念。

def city_finder(text_data):
    nlp = spacy.load('en_core_web_sm')
    doc = nlp(text_data)
    for ents in doc.ents:
        if(ents.label_ == 'GPE'):
            return (ents.text)

这是我用来从文本数据中查找城市名称的代码,但是其准确性不是很高。当我运行此代码时,结果将是其他名称而不是城市名称。在自然语言处理或任何其他领域中,我缺少什么吗?

text corpus named-entity-recognition
1个回答
0
投票

有一些标准库可用于提取特定于语言的POS。你可以检查一下其他用于提取名词的库,例如,来自CLiPS(请参见https://www.clips.uantwerpen.be/pages/pattern)的模式库实现了POS的德语和西班牙语等语言。

© www.soinside.com 2019 - 2024. All rights reserved.