尝试在文本分析中提取实体时openNLPmodels.en错误

Question

我使用R3.1.2进行文本分析来提取实体（kind = person）。我从http://datacube.wu.ac.at加载了openNLP和openNLPmodels.en。但我得到以下错误。

Maxent_Simple_Entity_Detector中的错误（语言，种类，问题，模型）：无法找到语言“en”的模型文件和善意的“人”。显然，已经安装了包'openNLPmodels.en'，但没有提供此模型。

分辨率是多少？

谢谢Sridevi

Answer 1

从http://datacube.wu.ac.at/src/contrib/安装openNLPmodels.en。 CRAN上不再提供此软件包。因此，下载处于脱机状态并将其安装在R / Rstudio上。它对我有用。！华友世纪！

Answer 2

我有同样的问题，并能够解决它安装额外的软件包“RWeka”和“qdap”。另外，确保安装了“rJava”。简而言之，运行以下命令，看看在需要包之后，您是否能够运行代码。

install.packages(c("NLP", "openNLP", "RWeka", "qdap", "rJava"))

Answer 3

因为你可能安装了openNLPmodels.en并正确加载它。我进入了openNLP的parse.R的源代码，发现了这样的东西

package <- "openNLPmodels.en"
model <- system.file("models/en-parser-chunking.bin",
                     package = package) .

Points to be noted ..

1）我在一台R版本为3.3.2的Linux机器上。 2）安装了openNLPmodels.en形式的https://cran.r-project.org/src/contrib/Archive/openNLPmodels.en/版本。令我惊讶的是我没有在其路径中找到“models / en-parser-chunking.bin”。所以我已经下载了相应的解析器文件。来自http://opennlp.sourceforge.net/models-1.5/并将其放在名为models的文件夹中。并能够使它工作。

parse_annotator <- Parse_Annotator()
## Compute the parse annotations only.
p <- parse_annotator(s, a2)

现在这段代码对我有用了。在此之前，我有类似的错误。

annotate(s, Maxent_Chunk_Annotator(), a3)
#Error in Maxent_Simple_Chunker(language, probs, model) : 
Could not find model file for language 'en'.

显然，安装包'openNLPmodels.en'现在猜猜是什么，我已经在Maxent_Simple_Chunker中给出了模型（chunker.bin文件）的路径，并且能够使它工作。

Answer 4

让我提供适合我的确切步骤。这些步骤假设您已经有OpenNLP，rJava库正常工作。

install.packages("openNLPmodels.en", dependencies=TRUE, repos = "http://datacube.wu.ac.at/")

导航到openNLPmodels.en库文件夹。对我来说，这是\ filesrv \ users \ MYNAME \ My Documents \ R \ win-library \ 3.4 \ openNLPmodels.en
在openNLPmodels.en中创建一个名为models的新文件夹