lucene 相关问题

Lucene一词指的是开源Java全文搜索引擎库，也指整个生态系统，包括lucene.net，solr，elasticsearch和zend-search-lucene。

lucene 搜索未返回任何结果

目前将hibernate搜索升级到5；我已经进行了迁移所需的更改，但搜索仍然返回 null “fullTextQuery.getResultList();”返回空。酒吧...

java lucene hibernate-search

回答 1 投票 0

显示Lucene索引的内容

我正在尝试在 Lucene 中调试索引文档，我需要查看索引的内容，以便我可以准确地看到文档是如何被索引的。据说卢克是这样做的，但没有文件...

lucene luke

回答 4 投票 0

从 Solr 查询中得到奇怪的结果

我正在使用 Datastax 6.8。这是我的 SOLR 架构：我正在使用 Datastax 6.8。这是我的 SOLR 架构： <?xml version="1.0" encoding="UTF-8" standalone="no"?> <schema name="autoSolrSchema" version="1.5"> <types> <fieldType class="org.apache.solr.schema.StrField" name="StrField"/> <fieldType class="org.apache.solr.schema.TextField" name="NameField"> <analyzer type="index"> <filter class="solr.ASCIIFoldingFilterFactory"/> <tokenizer class="solr.LowerCaseTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.LowerCaseTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt"/> <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> </analyzer> </fieldType> </types> <fields> <field indexed="true" multiValued="false" name="nama" type="StrField"/> <field indexed="true" multiValued="false" name="nama_copy" type="NameField"/> </fields> <uniqueKey>(nama)</uniqueKey> <copyField dest="nama_copy" source="nama"/> </schema> 我连续有这个字段值batamindo v 然后我运行了这个查询 http://my_ip_address:8983/solr/search.form/select?wt=json&indent=true&fl=nama&q=nama_copy:batamindo\ v 我得到了非常好的结果 { "responseHeader":{ "status":0, "QTime":8}, "response":{"numFound":579,"start":0,"docs":[ { "nama":"BATAMINDO V "}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}, { "nama":"BATAMINDO V"}] }} 但是当我跑步时 http://my_ip_address:8983/solr/search.form/select?wt=json&indent=true&fl=nama&q=nama_copy:batamindo\ vi 我的搜索结果非常糟糕 { "responseHeader":{ "status":0, "QTime":14}, "response":{"numFound":602,"start":0,"docs":[ { "nama":"MV. VINCA"}, { "nama":"MV. VINASHIP PEARL"}, { "nama":"MV. VINASHIP PEARL"}, { "nama":"MV. VINCENT TRADER"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"NAVI SUNNY"}, { "nama":"MV. MEGHNA VICTORY"}, { "nama":"MT. GOLDEN VIOLET"}, { "nama":"MT. GOLDEN VIOLET"}] }} 这里发生了什么？您所看到的是预期行为。 NGramFilterFactory类将字符串标记为N大小的克。在您的情况下，字符串根据您的架构定义被分成 2 到 15 个字符的克： <filter class="solr.NGramFilterFactory" maxGramSize="15" minGramSize="2"/> 对于像 cassandra 这样的输入字符串，N 元语法过滤器会生成以下语法：大小=2：ca as ss sa an nd dr ra 大小=3：cas ass ssa san and ndr dra 大小=4：cass assa ssan sand andr ndra 依此类推，直到大小=15 对于搜索词 ss，Solr 查询将获得 ss、ass、ssa、assa、ssan 等的匹配项。在您的搜索词为 vi 的情况下，预计会匹配 vinca、vinaship、vincent、victory、navi、violet 等。有关更多信息，请参阅Solr 中的文档分析。干杯！

cassandra solr lucene datastax-enterprise

回答 1 投票 0

Lucene HNSW KNN 向量搜索支持预过滤吗？

Lucene 最近为 Lucene 9.0.0 添加了 HNSW 近似最近邻搜索 (ANN)，基于此原始分支：https://issues.apache.org/jira/browse/LUCENE-9004。 Lucene是否支持预过滤...

lucene approximate-nn-searching

回答 2 投票 0

Hibernate 搜索：使用 Ngram 过滤器对数据进行索引，并且在搜索时由于查询时标记化而给出不正确的结果

我有一个具有此配置的分析仪，搜索映射// .analyzerDef(BaseEntity.CUSTOM_SEARCH_INDEX_ANALYZER, WhitespaceTokenizerFactory.class)// .filter(LowerCaseFilterFactory...

java hibernate elasticsearch lucene hibernate-search

回答 1 投票 0

ElasticSearch 集群上并发搜索请求数

我的目标是计算两件事 Q1：一个elasticsearch集群可以同时处理多少个搜索请求 Q2：elasticsearch 集群之前可以在其队列中容纳多少个搜索请求