将 SELECT DISTINCT ON 查询从 Postgresql 转换为 MySQL

问题描述 投票:0回答:5

我一直在使用 PostgreSQL,现在迁移到 MySQL

在我的查询中,我使用的是PostgreSQL

SELECT DISTINCT ON (col1, col2, col3)
,我想知道MySQL中是否有此语句的对应项。

mysql postgresql select group-by distinct
5个回答
66
投票

没有完全等效的方法可以将使用 SELECT DISTINCT ON 的 Postgresql 查询转换为 MySQL。

Postgresql SELECT DISTINCT ON

在 Postgresql 中,以下查询将消除表达式

(col1, col2, col3)
匹配的所有行,并且只会保留每组匹配行的“第一个 col4,col5 行”:

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

所以如果你的桌子是这样的:

col1 | col2 | col3 | col4 | col5
--------------------------------
1    | 2    | 3    | 777  | 888
1    | 2    | 3    | 888  | 999
3    | 3    | 3    | 555  | 555

我们的查询将仅保留 (1,2,3) 的一行和 (3,3,3) 的一行。结果行将是:

col4 | col5
-----------
777  | 888
555  | 555

请注意,每组的“第一行”是不可预测的,除非我们指定 ORDER BY,否则我们的第一行也可能是 (888, 999):

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

(表达式上的 DISTINCT 必须与最左边的 ORDER BY 表达式匹配,但 ORDER BY 可以包含其他表达式)。

MySQL 对 GROUP BY 的扩展

MySQL 扩展了 GROUP BY 的使用,以便我们可以选择未在 GROUP BY 子句中命名的非聚合列。每当我们选择非聚合列时,服务器都可以自由地从该列的每个组中选择任何值,因此结果值将是不确定的。

所以这个 Postgresql 查询:

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

可以被认为等同于这个MySQL查询:

SELECT col4, col5
FROM tablename
GROUP BY col1, col2, col3

Postgresql 和 MySQL 都会为每个(col1、col2、col3)返回“第一行”,并且在这两种情况下,返回的行都是不可预测的,因为我们没有指定和 order by 子句。

很多人很想用 ORDER BY 来转换这个 Postgresql 查询:

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

这个:

SELECT col4, col5
FROM (
  SELECT col1, col2, col3, col4, col5
  FROM tablename
  ORDER BY col1, col2, col3, col4
) s
GROUP BY col1, col2, col3

这里的想法是将 ORDER BY 应用于子查询,以便当 MySQL 按 col1、col2、col3 分组时,它将保留第一个遇到的 col4 和 col5 值。 这个想法很好,但它是错误的! MySQL 可以自由地为 col4 和 col5 选择任何值,并且我们不知道哪个是第一个遇到的值,这取决于优化器。所以我将其更正为:

SELECT t1.col4, t1.col5
FROM tablename t1 INNER JOIN (SELECT col1, col2, col3, MIN(col4) as m_col4
                              FROM tablename
                              GROUP BY col1, col2, col3) s
     ON t1.col1=s.col1
        AND t1.col2=s.col2
        AND t1.col3=s.col3
        AND t1.col4=s.m_col4
GROUP BY
  t1.col1, t1.col2, t1.col3, t1.col4

但这开始变得更加复杂。

结论

作为一般规则,没有一种确切的方法将 Postgresql 查询转换为 MySQL 查询,但是有很多解决方法,结果查询可能与原始查询一样简单,也可能变得非常复杂,但这取决于关于查询本身。


1
投票

使用子查询确定顺序,使用外部查询对它们进行分组。

就像 @a_horse_with_no_name 指出的那样,这是有效的,因为 MySQL 允许部分

group by
,与其他 DBMS 不同。

例如:

CREATE TABLE customer_order
    (`customer` varchar(5), `item` varchar(6), `date` datetime)
;

INSERT INTO customer_order
    (`customer`, `item`, `date`)
VALUES
    ('alice', 'widget', '2000-01-05 00:00:00'),
    ('bob', 'widget', '2000-01-02 00:00:00'),
    ('alice', 'widget', '2000-01-01 00:00:00'),
    ('alice', 'wodget', '2000-01-06 00:00:00')
;

查询每个客户的第一笔订单:

select *
from
  (select customer, item, date
  from customer_order
  order by date) c
group by customer

结果:

| CUSTOMER |   ITEM |                           DATE |
|----------|--------|--------------------------------|
|    alice | widget | January, 01 2000 00:00:00+0000 |
|      bob | widget | January, 02 2000 00:00:00+0000 |

http://sqlfiddle.com/#!2/6cbbe/1


0
投票

如果您想从一对多关系连接最后一个(或某些特定)记录,您可以这样做:

SELECT * FROM customer c LEFT JOIN purchase p 
ON (SELECT purchaseID FROM purchase WHERE customerID = c.customerID ORDER BY Purchase_Date DESC LIMIT 1) = purchaseID

-5
投票

您无法从多列中选择不同的值。选择使用这样的查询时

select distinct col1, col2 from table

-6
投票

您应该迁移到 PDOMSYQLI 而不是 MYSQL,因为它已被弃用。

关于你的问题你可以做

   SELECT DISTINCT col1, col2, col3

    SELECT col1, col2, col3
    ........

    GROUP BY col1 --//--- or whatever column you want to be distinct
© www.soinside.com 2019 - 2024. All rights reserved.