破折号和下划线的preg_match的奇怪行为

问题描述 投票:3回答:2

我有两个表达方式。两者几乎相同,首先我检查以3个破折号结尾的字符串,然后以3个下划线结束

$str="this-is_normal-test---";
$str= preg_match("/[a-zA-z0-9]+(-+)$/",$str,$matches);
print_r($matches);

$str="this-is_normal-test___";
$str= preg_match("/[a-zA-z0-9]+(_+)$/",$str,$matches);
print_r($matches);

这是输出:

Array
(
    [0] => test---
    [1] => ---
)
Array
(
    [0] => test___
    [1] => _
)

问题是,第一个显示所有三个匹配的短划线,第二个显示只有一个下划线匹配。为什么?这种奇怪行为的逻辑/发生是什么?

php regex preg-match
2个回答
4
投票

在US-ASCII(和大多数派生编码)中,[A-z]范围包括_但不包括-

echo implode('', range('A', 'z'));
ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz

我想这是一个错字,你的意思是:

'/[a-z0-9]+(-+)$/i'

2
投票

我不完全理解为什么这会解决它,但这是因为你有A-z,而不是A-Z,所以:

$str= preg_match("/[a-zA-Z0-9]+(_+)$/",$str,$matches); //note uppercase Z

我只能假设在确定A-z(小写字母Z)之间的所有字符时,它似乎包括下划线,一个字母数字字符。

© www.soinside.com 2019 - 2024. All rights reserved.