斯坦福 CoreNLP 和表情符号?

问题描述 投票:0回答:2

到目前为止,当我尝试使用表情符号和词性标注器时,它显示为未知符号、小方框。有没有办法让 POS 标记器与表情符号一起使用?表情符号(例如

😀
)unicode 版本。

java nlp stanford-nlp
2个回答
3
投票

从 3.8.0 版本开始,Stanford CoreNLP 支持表情符号。

发行说明。


2
投票

只要您的代码、系统和斯坦福 CoreNLP 代码中的字符编码正确,表情符号就应该正确表示。但是,您将遇到两个更基本的问题:

首先,表情符号只有一个字符长,除了不定冠词之外,它们不太可能被标记为任何其他内容。英语中的“a”。智能分词器可能可以更好地理解表情符号,但我对此表示怀疑。

其次,也是更重要的一点,词性标注器注释词性。表情符号不是语音的一部分。至少,它们是一个独立的、新的标记类别,但肯定不符合语法。

综上所述...您知道他们的字符代码...他们已经被标记了。

© www.soinside.com 2019 - 2024. All rights reserved.