Unicode catagorie for invisible unicode ZWSP etc

问题描述 投票:0回答:0

首先我不是在这里寻找答案,所以请不要将其标记为已解决 如何删除字符串中所有不可打印的字符?

我需要清理 CSV 文件中的文件内容,因此需要分析内容

我使用以下模式来匹配所有不可打印的unicodes

/[^\P{Cc}\p{Cf}\p{Cn}\p{Cs}]/u

但是好像ZWSP

\x20\x0B
(零宽空格)不匹配。是否有一个 unicode 目录,其中(如
\p{Cf}
)ZWSP 是其中的一部分?

https://www.regular-expressions.info/unicode.html

更新

$pattern = '/[^\P{Cc}\p{Cf}\p{Cn}\p{Cs}\s]/u';
$str = "\x64\x20\x20\x0B\x20\x0B\x48";

$non_printable  = preg_match_all($pattern, $str, $match);
echo "num: $non_printable\n";
print_r($match);
php regex pcre
© www.soinside.com 2019 - 2024. All rights reserved.