希伯来斯坦福大学NLP标签集

问题描述 投票:0回答:1

我正在尝试查找Stanford NLP使用的希伯来树库中使用的标记集的exact列表。找到这个标签集似乎比找到一个POS标签机更困难:)

是否有任何工具可用于读取用于训练(Penn?)树库的标签集?

nlp stanford-nlp hebrew pos-tagger penn-treebank
1个回答
0
投票

对于stanfordnlp python软件包,对于所有语言,使用的POS标签集为Universal Dependencies (UD) v2 tag set。某些UD语料库还包括原始POS标签集,通常更细粒度。但是,尽管希伯来语树库最初是用其自己的POS标签集构建的,然后又覆盖了UD,但似乎UD存储库中提供的版本仅带有UD标签集。个别语言只能使用UD POS标签集的子集。您可以在Treebank hub page for the Hebrew TreeBank上找到其详细信息。您会看到那里使用了17个UD POS标签中的15个。

© www.soinside.com 2019 - 2024. All rights reserved.