首先我不是在这里寻找答案,所以请不要将其标记为已解决 如何删除字符串中所有不可打印的字符?
我需要清理 CSV 文件中的文件内容,因此需要分析内容
我使用以下模式来匹配所有不可打印的unicodes
/[^\P{Cc}\p{Cf}\p{Cn}\p{Cs}]/u
但是好像ZWSP
\x20\x0B
(零宽空格)不匹配。是否有一个 unicode 目录,其中(如\p{Cf}
)ZWSP 是其中的一部分?
https://www.regular-expressions.info/unicode.html
$pattern = '/[^\P{Cc}\p{Cf}\p{Cn}\p{Cs}\s]/u';
$str = "\x64\x20\x20\x0B\x20\x0B\x48";
$non_printable = preg_match_all($pattern, $str, $match);
echo "num: $non_printable\n";
print_r($match);