我们想做一个 POC,它使用基于 Java 的 NLP 库,如 Stanford Core NLP 和/或 Deeplearning4J 来训练/使用可以提取洞察力/意义/摘要的模型,并针对自定义文档存储库/数据库(NoSQL)提供用户查询的答案数据库/CSV)。是否有任何好的文档/简单的代码示例来说明这些 Java NLP 库的这种功能?
(这里是 DL4J 维护者):
如果你想直接使用 transformers 和其他模型,Deeplearning4j 会很有用。如果您只是在寻找带有模型的开箱即用工具包,我建议您使用 stanford nlp 和其他类似框架。
是的,你可以将 Java 用于 NPL,特别是如果你想比 Python 更快。 你可以使用的最好的工具包是 OpenNLP Apache,有了它你可以像 Python 中的 Spacy 一样做一个管道。
我认为最好的选择是Apache openNLP
这里是完整的项目文档,这里是工作示例 您可以在 GitHub