ElasticSearch - 用于在URLS中搜索产品的分析器

问题描述 投票:0回答:1

我是ES的新手。

我有3000个关键字,需要将它们与数百万个URL匹配,这些URL的url编码字符如“+”。

喜欢

www.nicecars.com/BrownCars_Nice_Sedan_with-Wheels_4+
www.nicecars.com/BrownCars_Nice_Sedan_with-Wheels_4

BrownCars是哪个品牌。

到目前为止,最好的工作分析仪是pattern,但它降低了重要的+

那么如何解除像+这样的字符?

或者是否有更好的分析仪来执行此任务?

elasticsearch
1个回答
2
投票

您可以自定义模式分析器,在Char过滤器中不要过滤+

Analysis流程包括以下三个步骤:

  1. 字符过滤器(这里可以添加/删除文本中的某些字符)
  2. Tokenizer(将文本分解为标记)
  3. 令牌过滤器(将令牌转换为小盒等)

提供模式分析器定义会很有用,因此我们可以从我们这边进行测试并根据您的需要进行修改。

© www.soinside.com 2019 - 2024. All rights reserved.