我一直在尝试按照教程这里设置 Solr 和 Nutch。
但是,我被困在教程的最后,它说: 之后,您需要将 Nutch 指向 Solr 实例:
(Nutch 1.15及更高版本)编辑文件conf/index-writers.xml,参见IndexWriters
我应该如何编辑文件以将 Nutch 指向 Solr 实例?
我查看了链接的 IndexWriters 页面,但找不到任何答案。
我使用默认的核心名称“nutch”。
我能够让 Nutch 爬行,但在 Solr 核心中看不到数据。
根据提到的文档,它最终可能会出现在一个简单的文件中:
<writers xmlns="http://lucene.apache.org/nutch"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://lucene.apache.org/nutch index-writers.xsd"><writer id="indexer_solr_1" class="org.apache.nutch.indexwriter.solr.SolrIndexWriter">
<parameters>
<param name="url" value="YOUR_SOLR_URL_HERE_INCL_SLASH_SOLR"/>
</parameters>
<mapping>
<copy/>
<rename/>
<remove/>
</mapping></writer></writers>