日语字符正则表达式

问题描述 投票:1回答:1

我有一个模式正则表达式用于检查匹配的字符串:

\b(\w+)(?:株式会社|会社)(?:\s*)(\w+)(?:ご担当者様|様)

问题:此模式与日语字符不匹配

示例:

CompanyA株式会社Daniz様

=>匹配此模式。

但是

スタッフ株式会社本社様

=>与该模式不匹配

我如何更改正则表达式以匹配(日语字符,特殊字符和普通字符a-z A-Z 0-9)?

java regex
1个回答
2
投票

您可以使用Unicode properties来匹配不同类别的字符。例如,要匹配任何语言的任何字母,可以使用\p{gc=IsL}而不是\w,后者仅匹配拉丁字母(加上下划线和数字)。或者,您可以将特定脚本仅用于日语字符。在您的问题中,尚不清楚您要的是字母还是拉丁字母+日语字母。另外,您要包括哪些“特殊字符”?

© www.soinside.com 2019 - 2024. All rights reserved.