我正在使用Elasticsearch内置的简单分析器https://www.elastic.co/guide/en/elasticsearch/reference/1.7/analysis-simple-analyzer.html,该分析器使用小写标记器。文本apple 8 IS Awesome以以下格式标记。
"apple",
"is",
"awesome"
您可以清楚地看到,它错过了对数字8
进行标记化的功能,因此,现在如果我仅使用8
进行搜索,则我的消息将不会出现在搜索中。
我浏览了ES可用的所有可用分析仪,但找不到符合我要求的合适分析仪。
如何使用自定义或内置的ES分析器将所有带有数字的单词标记化?
您的问题是关于简单分析器的,但是您提到了一个非常旧的文档链接。尝试https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-simple-analyzer.html
[就像Val告诉您的那样,您可能正在寻找standard analyser。如果您想查看区别,请尝试analysis api: