如何在Java应用程序中使用Nutch API?

问题描述 投票:4回答:1

我想在我的java应用程序中使用Nutch API来从网站抓取pdf链接进行分析,如何在我的java应用程序中使用Nutch jar呢?我能举个例子吗?

java web-crawler nutch
1个回答
0
投票

首先,您需要通过下载并提取Nutch然后通过发出命令来运行Nutch作为服务器,

bin/nutch startserver

之后,您可以在Java中使用REST客户端,如RestTemplate,并调用所需的API。以下是Nutch提供的所有REST API的文档。

https://wiki.apache.org/nutch/Nutch_1.X_RESTAPI/RunningJobsTutorial

© www.soinside.com 2019 - 2024. All rights reserved.