我发布了一个字段值为“Pineapple upside down cake”的文档。我想点击pineapple
,pine*
,*side
,pi?????le
,upside down
等。我选择了text_en
,它找不到*side
也没有找到pi?????le
。
什么开箱即用的字段类型会给我以上所有的点击?
我正在使用Solr 7.6。
如果你想保留所有的标记(正如我之前关于这个问题的评论,text_en
类型包含一个词干分析器),请使用只有WhitespaceTokenizer和LowercaseFilter的字段类型。你必须自己定义这个字段。
我猜你可以使用text_general
来获得一个不错的答案(它使用StandardTokenizer,所以它会分裂几个案例而不仅仅是空格)。
原因是通配符搜索没有进行大多数处理(因为当你没有完整的令牌时,不可能正确处理词干,拆分等),因此任何通配符搜索都将针对生成的令牌列表经过处理。