Nutch 1.19 Webgraph命令错误:OutlinkDb作业没有成功,作业id:job_local306968781_0001,作业状态:FAILED,原因:NA

问题描述 投票:0回答:0

我正在尝试在执行爬网后在 Apache Nutch 中创建一个网络图。这是我用来创建网络图的命令。

bin/nutch webgraph -segmentDir crawl/segments/ -webgraphdb crawl/webgraphdb

运行后出现此错误。

OutlinkDb job did not succeed, job id: job_local306968781_0001, job status: FAILED, reason: NA
2023-04-23 02:32:53,083 ERROR o.a.n.s.w.WebGraph [main] WebGraph: java.lang.RuntimeException: OutlinkDb job did not succeed, job id: job_local306968781_0001, job status: FAILED, reason: NA
    at org.apache.nutch.scoring.webgraph.WebGraph.createWebGraph(WebGraph.java:610)
    at org.apache.nutch.scoring.webgraph.WebGraph.run(WebGraph.java:809)
    at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:81)
    at org.apache.nutch.scoring.webgraph.WebGraph.main(WebGraph.java:724)

我看到我的段文件夹中有 2 个段。我注意到错误只发生在第二段。

有人可以帮我使用 Nutch 获取 webgraph 并告诉我哪里出错了。

java apache solr nutch
© www.soinside.com 2019 - 2024. All rights reserved.