Stanford NLP core 4.0.0不再拆分西班牙语的动词和代词

问题描述 投票:0回答:1

非常有用,Stanford NLP核心3.9.2用于将西班牙语动词和代词分解在一起

enter image description here

这是4.0.0输出:

enter image description here

先前的版本包含更多.tagger文件。这些未包含在4.0.0发行版中。

enter image description here

是原因。他们会加回来吗?

windows stanford-nlp
1个回答
0
投票

[Stanford CoreNLP 4.0.0仍需要进行一些文档更新。

主要变化是,添加了新的多单词令牌注释器,使令牌化符合UD标准。因此,新的默认西班牙管道应运行tokenize,ssplit,mwt,pos,depparse,ner。由于可能需要进行一些修改,因此此时可能无法从服务器演示中运行这样的管道。我可以尝试将不久的修改发送给您。我们将尝试在初夏发布新版本,以解决我们错过的此类问题。

不幸的是,它不会拆分您的示例中的单词,但是我认为在许多情况下,它可以完成正确的操作。西班牙语mwt模型仅基于大型术语词典,并进行了调整以优化西班牙语培训数据上的表现。

© www.soinside.com 2019 - 2024. All rights reserved.