[Stanford CoreNLP 4.0.0仍需要进行一些文档更新。
主要变化是,添加了新的多单词令牌注释器,使令牌化符合UD标准。因此,新的默认西班牙管道应运行tokenize,ssplit,mwt,pos,depparse,ner
。由于可能需要进行一些修改,因此此时可能无法从服务器演示中运行这样的管道。我可以尝试将不久的修改发送给您。我们将尝试在初夏发布新版本,以解决我们错过的此类问题。
不幸的是,它不会拆分您的示例中的单词,但是我认为在许多情况下,它可以完成正确的操作。西班牙语mwt
模型仅基于大型术语词典,并进行了调整以优化西班牙语培训数据上的表现。