搜索空格敏感的cts

问题描述 投票:1回答:1

我只是想创建一个未经过滤的whitespace-sensitive cts查询,并以某种方式无法使其工作(没有其他约束)。

这是我的测试环境:

xquery version "1.0-ml";

xdmp:document-insert("test1.xml", <test><title>test word</title></test>);
xdmp:document-insert("test2.xml", <test><title>test-word</title></test>);


cts:search(//test, cts:element-value-query(xs:QName("title"), "test word", ("whitespace-sensitive")), ("unfiltered"))

我有两个文件,只有一个字符-不同。执行此cts搜索将返回两个文档。看着执行计划的事情变得奇怪了。最终计划显示了这一点:

<qry:term-query weight="1">
 <qry:key>5029803220044614354</qry:key>
 <qry:annotation>element(title,value("test","word"))</qry:annotation>
</qry:term-query>

MarkLogic似乎在没有空格的情况下搜索testword这两个词。它似乎没有使用选项whitespace-sensitive。只有当我添加三个选项“区分大小写”,“变音符号敏感”和“标点符号敏感”时,它才会执行实际的空格敏感搜索。删除任何选项会导致对空格不敏感的搜索:

xdmp:plan(cts:search(//test, cts:element-value-query(xs:QName("title"), "test word", ("case-sensitive", "diacritic-sensitive", "punctuation-sensitive", "whitespace-sensitive")), ("unfiltered")))
=> ...
<qry:term-query weight="1">
 <qry:key>11298961959398038325</qry:key>
 <qry:annotation>element(title,value("test"," ","word"))</qry:annotation>
</qry:term-query>

我误解了“空白敏感”选项吗?

使用MarkLogic 9.8-0。

marklogic
1个回答
2
投票

我想也许你期望所有的选择都可以解决未经过滤的问题。事实并非如此。如果不进行过滤,则无法解析选项和索引设置的某些选项和组合。通常,可以从索引中解析空白敏感查询的唯一情况是查询是否为“精确”值查询。通常,空格(和标点符号)不会被编入索引。这就是计划向您展示的内容。由于索引中没有该信息,因此未经过滤的查询将无法在此基础上排除结果。过滤器也包含实际数据,可以根据空白区域排除结果并返回正确的结果。

© www.soinside.com 2019 - 2024. All rights reserved.