我一直在绞尽脑汁试图解决这个挑战。
PHP 默认的
sort
函数没有提供解决方案,但是使用 usort
也不容易。
这就是我要解决的问题。我按以下顺序创建了一个数组:
$data = array( '_', '@', ...range(-10, 10), ...range('A', 'Z'), ...range('a', 'z') )
现在我想使用
usort
对这个数组进行排序,以便:
negative
数字在前,uppercase
接下来是字母_
& @
字符如下lowercase
字母如下positive
数字结束订单有点像:
/*
array(
"-10",
"-9",...
"A",
"B",...
"_",
"@", // @ may come first
"a",
"b",...
"1",
"2"...
) */
有什么方法可以解决这个问题吗?
usort($data, function($a,$b) {
if( is_numeric($a) && (int)$a < 0 ) return -1; // take negative number to start
else {
if( !is_numeric($a) ) {
if( is_numeric($b) && (int)$b > 0 ) return -1;
else return $b < $a ? 1 : 0;
} else return 1; // take positive number to end
}
});
将其视为一个层次结构。您有 5 个不重叠的“类”要排序:负数、大写、符号、小写、正数。所以首先确定类别排序,如果两个项目的类别相同,则比较它们的值。
class MySorter {
const CLASS_NUM_NEG = 0;
const CLASS_STR_UC = 1;
const CLASS_STR_OT = 2;
const CLASS_STR_LC = 3;
const CLASS_NUM_POS = 4;
static function get_class($item) {
switch(gettype($item)) {
case 'integer':
case 'float':
return ($item < 0) ? self::CLASS_NUM_NEG : self::CLASS_NUM_POS;
case 'string':
$ord = ord($item[0]);
// note: below ord() calls are illustrative, and
// should be replaced with non-computed values to
// avoid repetitive work.
if( $ord >= ord('A') && $ord <= ord('Z')) {
return self::CLASS_STR_UC;
} else if( $ord >= ord('a') && $ord <= ord('z')) {
return self::CLASS_STR_LC;
} else {
return self::CLASS_STR_OT;
}
default:
throw new \Exception("Unhandled type: " . gettype($item));
}
}
static function compare($a, $b) {
$res = self::get_class($a) <=> self::get_class($b);
if( $res !== 0 ) { return $res; }
return $a <=> $b;
}
}
$data = [ '_', '@', ...range(-10, 10), ...range('A', 'Z'), ...range('a', 'z') ];
usort($data, ['MySorter', 'compare']);
echo json_encode($data);
旁白:类可以用作 ersatz 命名空间以包含相关的函数和变量,这样您就可以比完全内联的东西或将东西转储到本地/全局命名空间中更好地封装逻辑。
输出:
[-10,-9,-8,-7,-6,-5,-4,-3,-2,-1,"A","B","C","D","E","F","G","H","I","J","K","L","M","N","O","P","Q","R","S","T","U","V","W","X","Y","Z","@","_","a","b","c","d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u","v","w","x","y","z",0,1,2,3,4,5,6,7,8,9,10]
也许使用正则表达式对于一些开发人员来说更难阅读/维护,我没有费心比较性能,但它确实提供了一些不错的代码简洁性。在正则表达式模式中订购一系列可选的捕获组。正则表达式引擎将尝试满足最早出现的子模式,而剩余的捕获组甚至不会出现在匹配数组中 (
$m[]
)。然后,因为 PHP 在比较实际数据之前按数组的数量对数组进行排序,所以 $m
中元素最少的条目将首先按 array_multisort()
排序。当然,这可以使用 u
模式修饰符来增强以尊重多字节字符串。
代码:(演示)
$m = [];
foreach ($data as $v) {
preg_match('/(-\d+)?([A-Z]+)?([^A-Za-z0-9]+)?([a-z]+)?(\d+)?/', $v, $m[]);
// ^^^- positive integers
// ^^^^^^- lowercase letters
// ^^^^^^^^^^^^^- non-letters, non-numbers
// ^^^^^^- uppercase letters
// ^^^^- negative integers
}
array_multisort($m, $data);
var_export($data);
更直观和易于扩展/维护的是使用速记三元组和宇宙飞船操作员比较的后备比较,直到适合常规排序。
usort(
$data,
fn($a, $b) => ($b < 0 <=> $a < 0) // prioritize negatives
?: (ctype_upper((string) $b) <=> ctype_upper((string) $a)) // prioritize uppercase letters
?: (is_int($a) <=> is_int($b)) // deprioritize integers
?: ($a <=> $b) // sort normally
);
var_export($data);
或者,如果性能是一个问题,通过准备评估数组来减少所需函数调用的总数,然后调用
array_multisort()
。 (演示)
$negatives = [];
$uppers = [];
$integers = [];
foreach ($data as $v) {
$negatives[] = $v < 0;
$uppers[] = ctype_upper((string) $v);
$integers[] = is_int($v);
}
array_multisort(
$negatives,
SORT_DESC,
$uppers,
SORT_DESC,
$integers,
$data
);
var_export($data);
相关: