我有一个模式正则表达式用于检查匹配的字符串:
\b(\w+)(?:株式会社|会社)(?:\s*)(\w+)(?:ご担当者様|様)
问题:此模式与日语字符不匹配
示例:
CompanyA株式会社Daniz様
=>匹配此模式。
但是
スタッフ株式会社本社様
=>与该模式不匹配
我如何更改正则表达式以匹配(日语字符,特殊字符和普通字符a-z A-Z 0-9)?
您可以使用Unicode properties来匹配不同类别的字符。例如,要匹配任何语言的任何字母,可以使用\p{gc=IsL}
而不是\w
,后者仅匹配拉丁字母(加上下划线和数字)。或者,您可以将特定脚本仅用于日语字符。在您的问题中,尚不清楚您要的是字母还是拉丁字母+日语字母。另外,您要包括哪些“特殊字符”?