我如何搜索词干匹配?
即目前,item_title
字段中有许多文档包含“滑板”一词,但是只有3个文档包含“滑板”一词。因此,当我执行以下搜索时:
POST /my_index/my_type/_search
{
"size": 100,
"query" : {
"multi_match": {
"query": "skateboards",
"fields": [ "item_title^3" ]
}
}
}
我只得到3个结果。但是,我也希望返回带有单词“ skateboard”的文档。
根据我从Elasticsearch的了解,我希望通过在item_title
字段上指定一个映射来完成此操作,该映射包含一个分析器,该分析器索引每个单词的词干版本,但是我似乎找不到有关如何为此,这表明它是以不同的方式完成的。
建议?
这里是一个例子:
PUT /stem
{
"settings": {
"analysis": {
"filter": {
"filter_stemmer": {
"type": "stemmer",
"language": "english"
}
},
"analyzer": {
"tags_analyzer": {
"type": "custom",
"filter": [
"standard",
"lowercase",
"filter_stemmer"
],
"tokenizer": "standard"
}
}
}
},
"mappings": {
"test": {
"properties": {
"item_title": {
"analyzer": "tags_analyzer",
"type": "text"
}
}
}
}
}
为一些示例文档编制索引:
POST /stem/test/1
{
"item_title": "skateboards"
}
POST /stem/test/2
{
"item_title": "skateboard"
}
POST /stem/test/3
{
"item_title": "skate"
}
执行查询:
GET /stem/test/_search
{
"query": {
"multi_match": {
"query": "skateboards",
"fields": [
"item_title^3"
]
}
},
"fielddata_fields": [
"item_title"
]
}
并查看结果:
"hits": [
{
"_index": "stem",
"_type": "test",
"_id": "1",
"_score": 1,
"_source": {
"item_title": "skateboards"
},
"fields": {
"item_title": [
"skateboard"
]
}
},
{
"_index": "stem",
"_type": "test",
"_id": "2",
"_score": 1,
"_source": {
"item_title": "skateboard"
},
"fields": {
"item_title": [
"skateboard"
]
}
}
]
我还添加了fielddata_fields
元素,以便您可以看到如何对该字段的内容进行索引。如您所见,在两种情况下,索引项均为skateboard
。