我正在尝试使用 wordnet 库提取上位词。但是,我不清楚如何给一个词获取合成网的最短路径列表以获取其上位词。到目前为止,我在文档的帮助下尝试了这个:
在:
import wn, wn.taxonomy
lemas_list = []
dog = wn.synsets('katze', pos='n', lang='de')[0]
for path in wn.taxonomy.hypernym_paths(dog):
for i, ss in enumerate(path):
ss.lemmas()
lemas_list.append(ss.lemmas())
lemas_list
但是,这里我认为第一个列出的是错误的
['Tiger', 'Panthera tigris']
,因为它与katze
这个词没有太大关系。关于如何只获得相关的 hypernims 的任何想法?
出局:
[['Tiger', 'Panthera tigris'], ['Katze', 'Felidae']]