在 OpenSearch 中标记化时将分隔符保留为标记

问题描述 投票:0回答:1

如何在 OpenSearch 中定义一个标记生成器,将指定的分隔符保留为标记?

输入:

lorem123+ipsum dolar-sit
,带分隔符
+
\\s
-

输出代币:

lorem123
+
ipsum
dolar
-
sit

tokenize opensearch
1个回答
0
投票

只需使用正则表达式,例如

{
    "text": "my query",
    "tokenizer": {
        "type": "pattern",
        "pattern": "[·\\s\\-\\.,\\+\/\\|]"
    }
}

在您的索引配置中。

© www.soinside.com 2019 - 2024. All rights reserved.