我正在使用德语的spacy模型来提取命名实体,例如位置名称,人员名称和公司名称,但没有得到正确的结果作为输出。是否有我无法精确找出的缺失概念。
def city_finder(text_data):
nlp = spacy.load('en_core_web_sm')
doc = nlp(text_data)
for ents in doc.ents:
if(ents.label_ == 'GPE'):
return (ents.text)
这是我用来从文本数据中查找城市名称的代码,但是其准确性不是很高。当我运行此代码时,结果将是其他名称而不是城市名称。在自然语言处理或任何其他领域中,我缺少什么吗?
有一些标准库可用于提取特定于语言的POS。你可以检查一下其他用于提取名词的库,例如,来自CLiPS(请参见https://www.clips.uantwerpen.be/pages/pattern)的模式库实现了POS的德语和西班牙语等语言。