Elasticsearch是否支持令牌化程序以大写字符对术语进行令牌化,例如:将TheStarTech令牌化为术语[The, Star, Tech]。 Pattern tokenizer似乎有帮助,有什么建议吗?
TheStarTech
[The, Star, Tech]
查看此:World Delimited Token Filter
它可以满足您的需求以及更多。您可以根据需要输入参数。检查split_on_case_change参数,该参数默认为true。
split_on_case_change