SQL - 在 Group By 中使用别名

问题描述 投票:0回答:12

只是对 SQL 语法感到好奇。所以如果我有

SELECT 
 itemName as ItemName,
 substring(itemName, 1,1) as FirstLetter,
 Count(itemName)
FROM table1
GROUP BY itemName, FirstLetter

这是不正确的,因为

GROUP BY itemName, FirstLetter 

确实应该是

GROUP BY itemName, substring(itemName, 1,1)

但是为什么我们不能为了方便而简单地使用前者呢?

sql group-by alias
12个回答
396
投票

SQL 的实现就像按以下顺序执行查询一样:

  1. FROM 子句
  2. WHERE 子句
  3. GROUP BY 子句
  4. HAVING 条款
  5. SELECT 子句
  6. ORDER BY 子句

对于大多数关系数据库系统,此顺序解释了哪些名称(列或别名)有效,因为它们必须已在上一步中引入。

因此,在 Oracle 和 SQL Server 中,您不能在 SELECT 子句中定义的 GROUP BY 子句中使用术语,因为 GROUP BY 在 SELECT 子句之前执行。

但也有例外:MySQL 和 Postgres 似乎有额外的智能来允许它。


36
投票

您始终可以使用子查询,以便可以使用别名;当然,检查性能(数据库服务器可能会以相同的方式运行,但验证不会有什么坏处):

SELECT ItemName, FirstLetter, COUNT(ItemName)
FROM (
    SELECT ItemName, SUBSTRING(ItemName, 1, 1) AS FirstLetter
    FROM table1
    ) ItemNames
GROUP BY ItemName, FirstLetter

26
投票

至少在 PostgreSQL 中,您可以在 GROUP BY 子句中使用结果集中的列号:

SELECT 
 itemName as ItemName,
 substring(itemName, 1,1) as FirstLetter,
 Count(itemName)
FROM table1
GROUP BY 1, 2

当然,如果您以交互方式执行此操作并且编辑查询以更改结果中列的数量或顺序,这会开始变得很痛苦。但仍然。


17
投票

我不是在回答为什么会这样,只是想展示一种通过使用

CROSS APPLY
创建别名来解决 SQL Server 中的限制的方法。然后您可以在
GROUP BY
子句中使用它,如下所示:

SELECT 
 itemName as ItemName,
 FirstLetter,
 Count(itemName)
FROM table1
CROSS APPLY (SELECT substring(itemName, 1,1) as FirstLetter) Alias
GROUP BY itemName, FirstLetter

16
投票

由于处理的逻辑顺序,SQL Server 不允许您在 GROUP BY 子句中引用别名。 GROUP BY 子句在 SELECT 子句之前处理,因此在计算 GROUP BY 子句时不知道别名。这也解释了为什么可以在 ORDER BY 子句中使用别名。

这是有关 SQL Server 逻辑处理阶段的信息来源之一。


6
投票

注意,在分组依据中使用别名(对于支持它的服务,例如 postgres)可能会产生意想不到的结果。例如,如果您创建内部语句中已存在的别名,则 Group By 将选择内部字段名称。

-- Working example in postgres
select col1 as col1_1, avg(col3) as col2_1
from
    (select gender as col1, maritalstatus as col2, 
    yearlyincome as col3 from customer) as layer_1
group by col1_1;

-- Failing example in postgres
select col2 as col1, avg(col3)
from
    (select gender as col1, maritalstatus as col2,
    yearlyincome as col3 from customer) as layer_1
group by col1;

5
投票

某些 DBMS 允许您使用别名,而不必重复整个表达式。
Teradata 就是这样的一个例子。

出于这个SO问题中记录的原因,我避免使用比尔建议的序数位置符号。

简单而可靠的替代方法是始终重复 GROUP BY 子句中的表达式。
DRY 不适用于 SQL。


2
投票

对 SQLite 中视图的结果进行分组时,请注意使用别名。如果别名与任何基础表的列名(对于视图)相同,您将得到意想不到的结果。


0
投票

当年我发现 Rdb(以前的 DEC 产品,现在被 Oracle 支持)允许在 GROUP BY 中使用列别名。主流 Oracle 通过版本 11 不允许在 GROUP BY 中使用列别名。不确定 Postgresql、SQL Server、MySQL 等允许或不允许什么。 YMMV.


0
投票

至少在 Postgres 中,您可以在 group by 子句中使用别名:

选择 项目名称为项目名称1, substring(itemName, 1,1) 作为 FirstLetter, 计数(项目名称) 从表1 GROUP BY ItemName1, FirstLetter;

我不建议将别名重命名为大小写的更改,这会导致混乱。


0
投票

使用反引号字符 ( ` )

这在 MySQL 中对我有用(也可以在 HAVING 子句中使用):

 SELECT 
  itemName as ItemName,
  substring(itemName, 1,1) as FirstLetter,
  Count(itemName)
 FROM table1
 GROUP BY `itemName`, `FirstLetter`

0
投票

Oracle 23c将带来此功能。目前还不可能。

© www.soinside.com 2019 - 2024. All rights reserved.