我想在我的java应用程序中使用Nutch API来从网站抓取pdf链接进行分析,如何在我的java应用程序中使用Nutch jar呢?我能举个例子吗?
首先,您需要通过下载并提取Nutch然后通过发出命令来运行Nutch作为服务器,
bin/nutch startserver
之后,您可以在Java中使用REST客户端,如RestTemplate,并调用所需的API。以下是Nutch提供的所有REST API的文档。
https://wiki.apache.org/nutch/Nutch_1.X_RESTAPI/RunningJobsTutorial