PHP函数in_array不识别变音符号

问题描述 投票:1回答:2

我有一个代码来运行文件并获取所有图像。

$img = '/srv/www/wordpress-default/public_html/wp-content/uploads/2018/07/2018_07_DogOwner_VS_CatOwner_655x368_NL-500x281.jpg';
$dir = preg_replace('#[^/]*$#', '', $img); 
$image_files = scandir($dir); 
$image_name = @array_pop(explode('/', $img));
$find = $image_name;
var_dump(in_array($find, $image_files)); 

在这个例子中,我只运行一个图像。此代码返回true。问题是我的图像有德国标志(hundezubehör-für-sommer.jpg)。

$img = '/srv/www/wordpress-default/public_html/wp-content/uploads/2018/07/hundezubehör-für-sommer.jpg';

这返回false。任何想法为什么这不起作用?

编辑:我几天前问过这个问题:How to find a shortest name (string) of the same image with different naming。解决方法是:https://3v4l.org/T7lfU。我认为问题是当我从scandir运行代码时它无法找到变音符号。

php arrays image diacritics scandir
2个回答
4
投票

尽管字符串字母表,in_array函数仍然有效。我发现问题的原因是你的PHP文件和文件系统使用不同的编码,因此scandir读取的值有另一种编码,因此它与代码中编写的$img值不同。

尝试转换scandir结果的编码,使其与PHP文件编码匹配。例如:

// ...
$image_files = scandir($dir);
foreach ($image_files as &$file) {
    $file = mb_convert_encoding($file, 'UTF-8', 'Windows-1251');
}
// ...
var_dump(in_array($find, $image_files)); 

用文件系统编码替换UTF-8和PHP文件编码和Windows-1251


0
投票

问题是将öü等多字节字符存储到PHP文件中。

您可以尝试将字符串解释为多字节:

$img = utf8_encode('/srv/www/wordpress-default/public_html/wp-content/uploads/2018/07/hundezubehör-für-sommer.jpg');

编码,然后解码,使其更安全:

$img = html_entity_decode('/srv/www/wordpress-default/public_html/wp-content/uploads/2018/07/hundezubehör-für-sommer.jpg');

或反斜杠实体:

$img = "/srv/www/wordpress-default/public_html/wp-content/uploads/2018/07/hundezubeh\303\266r-f\303\274r-sommer.jpg";
© www.soinside.com 2019 - 2024. All rights reserved.