Solr可以提供每个文档的摘要并突出显示吗?

问题描述 投票:1回答:2

我对Solr很新,所以这可能是一个愚蠢的问题。

要求是查询应返回包含与查询文本匹配的突出显示的单词的(智能)摘要的结果。根据我的阅读,突出显示的文本将有效地成为文档摘要。我设法突出了工作,但是,Solr没有为某些文档提供突出显示。所以我的思考过程是,如果有一个Solr无法提供突出显示文本(即摘要)的文档,我会要求Solr:a)一般文档摘要(无论搜索词是什么),或b)top n个术语

但我无法在这两个项目中取得任何进展。

基本问题是为什么Solr没有为某些文档生成突出显示的摘要?我知道这些文件包含我正在搜索的术语。

任何有关这方面的见解将非常感激。谢谢。

EDIT1

查询:/select/?q=agents&start=0&fl=full_path,author,title,content-type,score&hl=true&hl.snippets=5。

该文档是PDF文档,“代理”一词出现一次。以下是PDF中包含单词的文本片段。 “Omega 3和6脂肪酸(eicosapentaenoic acid)和DHA(docasahexaenoic acid)是鱼油的成分,可作为抗炎剂。(通常,这些产品在健康食品商店中作为鲑鱼油或其他名称单独出售) 。)”

编辑2:

默认字段(df)设置为solrconfig.xml中的文本。我将所有字段复制到一个名为text的字段中,该字段定义为text_general。查看text_general字段类型,指定的唯一标记生成器是solr.StandardTokenizerFactory。我应该在此重申突出显示确实有效,问题是它不适用于某些文件。编辑1包含有关文档文本的信息,我认为应该使用给定的查询突出显示。

solr highlighting summary
2个回答
0
投票

The Unified Highlighter提供了这样的选项,你可以传递hl.defaultSummary = true


-1
投票

确保您希望突出显示文本的所有字段都存储=“true”。 Solr可以突出显示,它需要访问原始文本,访问字段的原始文本,需要“存储”。因此,需要验证上面提到上述文本的字段。例如:。

© www.soinside.com 2019 - 2024. All rights reserved.