Apache Solr过滤不起作用，但可以通过id检索

Question

背景：我们有一个迁移到docker的3节点solr云。它按预期工作，但是，对于插入的新数据，它只能通过id检索。一旦我们尝试使用过滤器，它就不会显示。请注意，仍可以过滤旧数据而不会出现任何问题。

数据库是通过spring-boot crud-like应用程序使用的。

更多背景：

应用程序和solr是由另一个人迁移的，我最近继承了代码库，所以我对实现并不熟悉，我仍在挖掘和调试。节点按原样迁移（数据已复制到docker挂载中）。

到目前为止我所拥有的：

我检查了所有solr节点的日志，并在调用应用程序时看到以下情况：

过滤：

2019-02-22 14:17:07.525 INFO  (qtp15xxxxx-15) [c:content_api s:shard1 r:core_node1 x:content_api_shard1_replica0] o.a.s.c.S.Request
[content_api_shard1_replica0]  
webapp=/solr path=/select 
params=
{q=*:*&start=0&fq=id-lws-ttf:127103&fq=active-boo-ttf:(true)&fq=(publish-date-tda-ttf:[*+TO+2019-02-22T15:17:07Z]+OR+(*:*+NOT+publish-date-tda-ttf:[*+TO+*]))AND+(expiration-date-tda-ttf:[2019-02-22T15:17:07Z+TO+*]+OR+(*:*+NOT+expiration-date-tda-ttf:[*+TO+*]))&sort=create-date-tda-ttf+desc&rows=10&wt=javabin&version=2} 
hits=0 status=0 QTime=37

获取ID：

2019-02-22 14:16:56.441 INFO  (qtp15xxxxxx-16) [c:content_api s:shard1 r:core_node1 x:content_api_shard1_replica0] o.a.s.c.S.Request
[content_api_shard1_replica0]  
webapp=/solr path=/get params={ids=https://example.com/app/contents/127103/middle-east&wt=javabin&version=2} 
status=0 QTime=0

免责声明：

我是Solr的绝对初学者，我正在通过文档ATM来更好地了解螺母和螺栓。

假设和WIP：

迁移它的人告诉我，只复制了数据，而不是配置。我已经获得了旧的配置文件（/opt/solr/server/solr/configsets/），我试图与新的配置文件进行比较。但是假设配置是默认值。
旧版本是6.4.2，新版本是6.6.5（不确定这可能是问题）

我们在这里遗漏了一些明显的东西吗？什么是超级混淆是可以通过id检索数据并且可以过滤OLD数据

更新：

经过一番研究后，我不得不说我已经排除了配置问题，因为当我从管理界面UI检查配置时，我看到了正确的配置。
此外，另一个奇怪的行为是在一段时间后（例如超过5天）可以查询数据。我可以看到，因为我从UI运行查询并按降序创建日期对其进行排序。从那里，我可以看到我的测试，我不是几天前

相关提交配置部分：

 <autoCommit> 
   <maxTime>${solr.autoCommit.maxTime:15000}</maxTime> 
   <openSearcher>false</openSearcher> 
 </autoCommit>

 <autoSoftCommit> 
   <maxTime>${solr.autoSoftCommit.maxTime:-1}</maxTime> 
 </autoSoftCommit>

管理端点的更多配置输出：

config:{  
   znodeVersion:0,
   luceneMatchVersion:"org.apache.lucene.util.Version:6.0.1",
   updateHandler:{  
      indexWriter:{  
         closeWaitsForMerges:true
      },
      commitWithin:{  
         softCommit:true
      },
      autoCommit:{  
         maxDocs:-1,
         maxTime:15000,
         openSearcher:false
      },
      autoSoftCommit:{  
         maxDocs:-1,
         maxTime:-1
      }
   },
   query:{  
      useFilterForSortedQuery:false,
      queryResultWindowSize:20,
      queryResultMaxDocsCached:200,
      enableLazyFieldLoading:true,
      maxBooleanClauses:1024,
      filterCache:{  
         autowarmCount:"0",
         size:"512",
         initialSize:"512",
         class:"solr.FastLRUCache",
         name:"filterCache"
      },
      queryResultCache:{  
         autowarmCount:"0",
         size:"512",
         initialSize:"512",
         class:"solr.LRUCache",
         name:"queryResultCache"
      },
      documentCache:{  
         autowarmCount:"0",
         size:"512",
         initialSize:"512",
         class:"solr.LRUCache",
         name:"documentCache"
      },
:{  
         size:"10000",
         showItems:"-1",
         initialSize:"10",
         name:"fieldValueCache"
      }
   },
...

Answer 1

根据您的示例，您只在查询实时获取端点时检索文档 - 即/get。此端点通过id查询返回文档，即使文档尚未提交到索引或已打开新的搜索器。

在对索引的任何更改对常规搜索端点可见之前，必须创建新的搜索器，因为旧的搜索者仍将使用旧的索引文件进行搜索。如果未创建新搜索器，则仍将返回陈旧内容。这与您所看到的行为相匹配，您不会打开任何新的搜索者，并且当搜索者因其他原因（可能是因为重新启动/另一个显式提交/合并/优化等等）而被回收时内容变得可见。

您的示例配置显示autoSoftCommit已禁用，而常规autoCommit设置为不打开新搜索器（因此，不会显示新内容）。我通常建议禁用此功能，而是依赖于在URL中使用commitWithin，因为它允许对不同类型的数据进行更大的可配置性，并允许您要求在添加数据后至少x秒内打开一个新的搜索器。 commitWithin的默认行为是在提交发生后将打开一个新的搜索器。

Answer 2

听起来您可能在升级时切换到默认的托管架构。查找先前安装中的schema.xml以及先前安装的solrconfig.xml中的一个部分。更多信息在https://lucene.apache.org/solr/guide/6_6/schema-factory-definition-in-solrconfig.html#SchemaFactoryDefinitioninSolrConfig-SolrUsesManagedSchemabyDefault

Apache Solr过滤不起作用，但可以通过id检索

问题描述投票：1回答：2

2个回答

最新问题

Apache Solr过滤不起作用，但可以通过id检索

问题描述 投票：1回答：2

2个回答

最新问题

问题描述投票：1回答：2