将 SELECT DISTINCT ON 查询从 Postgresql 转换为 MySQL

Question

我一直在使用 PostgreSQL，现在迁移到 MySQL。

在我的查询中，我使用的是PostgreSQL的

SELECT DISTINCT ON (col1, col2, col3)

，我想知道MySQL中是否有此语句的对应项。

Answer 1

没有完全等效的方法可以将使用 SELECT DISTINCT ON 的 Postgresql 查询转换为 MySQL。

Postgresql SELECT DISTINCT ON

在 Postgresql 中，以下查询将消除表达式

(col1, col2, col3)

匹配的所有行，并且只会保留每组匹配行的“第一个 col4，col5 行”：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

所以如果你的桌子是这样的：

col1 | col2 | col3 | col4 | col5
--------------------------------
1    | 2    | 3    | 777  | 888
1    | 2    | 3    | 888  | 999
3    | 3    | 3    | 555  | 555

我们的查询将仅保留 (1,2,3) 的一行和 (3,3,3) 的一行。结果行将是：

col4 | col5
-----------
777  | 888
555  | 555

请注意，每组的“第一行”是不可预测的，除非我们指定 ORDER BY，否则我们的第一行也可能是 (888, 999)：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

（表达式上的 DISTINCT 必须与最左边的 ORDER BY 表达式匹配，但 ORDER BY 可以包含其他表达式）。

MySQL 对 GROUP BY 的扩展

MySQL 扩展了 GROUP BY 的使用，以便我们可以选择未在 GROUP BY 子句中命名的非聚合列。每当我们选择非聚合列时，服务器都可以自由地从该列的每个组中选择任何值，因此结果值将是不确定的。

所以这个 Postgresql 查询：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

可以被认为等同于这个MySQL查询：

SELECT col4, col5
FROM tablename
GROUP BY col1, col2, col3

Postgresql 和 MySQL 都会为每个（col1、col2、col3）返回“第一行”，并且在这两种情况下，返回的行都是不可预测的，因为我们没有指定和 order by 子句。

很多人很想用 ORDER BY 来转换这个 Postgresql 查询：

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

这个：

SELECT col4, col5
FROM (
  SELECT col1, col2, col3, col4, col5
  FROM tablename
  ORDER BY col1, col2, col3, col4
) s
GROUP BY col1, col2, col3

这里的想法是将 ORDER BY 应用于子查询，以便当 MySQL 按 col1、col2、col3 分组时，它将保留第一个遇到的 col4 和 col5 值。 这个想法很好，但它是错误的！ MySQL 可以自由地为 col4 和 col5 选择任何值，并且我们不知道哪个是第一个遇到的值，这取决于优化器。所以我将其更正为：

SELECT t1.col4, t1.col5
FROM tablename t1 INNER JOIN (SELECT col1, col2, col3, MIN(col4) as m_col4
                              FROM tablename
                              GROUP BY col1, col2, col3) s
     ON t1.col1=s.col1
        AND t1.col2=s.col2
        AND t1.col3=s.col3
        AND t1.col4=s.m_col4
GROUP BY
  t1.col1, t1.col2, t1.col3, t1.col4

但这开始变得更加复杂。

结论

作为一般规则，没有一种确切的方法将 Postgresql 查询转换为 MySQL 查询，但是有很多解决方法，结果查询可能与原始查询一样简单，也可能变得非常复杂，但这取决于关于查询本身。

Answer 2

使用子查询确定顺序，使用外部查询对它们进行分组。

就像 @a_horse_with_no_name 指出的那样，这是有效的，因为 MySQL 允许部分

group by

，与其他 DBMS 不同。

例如：

CREATE TABLE customer_order
    (`customer` varchar(5), `item` varchar(6), `date` datetime)
;

INSERT INTO customer_order
    (`customer`, `item`, `date`)
VALUES
    ('alice', 'widget', '2000-01-05 00:00:00'),
    ('bob', 'widget', '2000-01-02 00:00:00'),
    ('alice', 'widget', '2000-01-01 00:00:00'),
    ('alice', 'wodget', '2000-01-06 00:00:00')
;

查询每个客户的第一笔订单：

select *
from
  (select customer, item, date
  from customer_order
  order by date) c
group by customer

结果：

| CUSTOMER |   ITEM |                           DATE |
|----------|--------|--------------------------------|
|    alice | widget | January, 01 2000 00:00:00+0000 |
|      bob | widget | January, 02 2000 00:00:00+0000 |

http://sqlfiddle.com/#!2/6cbbe/1

Answer 3

如果您想从一对多关系连接最后一个（或某些特定）记录，您可以这样做：

SELECT * FROM customer c LEFT JOIN purchase p 
ON (SELECT purchaseID FROM purchase WHERE customerID = c.customerID ORDER BY Purchase_Date DESC LIMIT 1) = purchaseID

Answer 4

您无法从多列中选择不同的值。选择使用这样的查询时

select distinct col1, col2 from table

Answer 5

您应该迁移到 PDO 或 MSYQLI 而不是 MYSQL，因为它已被弃用。

关于你的问题你可以做

   SELECT DISTINCT col1, col2, col3

或

    SELECT col1, col2, col3
    ........

    GROUP BY col1 --//--- or whatever column you want to be distinct

将 SELECT DISTINCT ON 查询从 Postgresql 转换为 MySQL

问题描述投票：0回答：5

5个回答

最新问题

将 SELECT DISTINCT ON 查询从 Postgresql 转换为 MySQL

问题描述 投票：0回答：5

5个回答

最新问题

问题描述投票：0回答：5