Apache Flink:如何删除选择查询中的重复项?

问题描述 投票:1回答:1

如何使用Apache fFlink删除SELECT查询中的重复项?

我的桌子是:enter image description here

我想删除ID中的重复项以保持最大范围

sql apache-flink flink-sql
1个回答
1
投票

假设查询是在静态数据集上运行的,可以使用常规SQL来解决。由于Flink实现了标准SQL,因此该查询不是特定于Flink的,而是可以在任何关系数据库系统上运行。

SELECT DISTINCT t.id, t.name, t.range 
  FROM t, (SELECT id, MAX(range) AS maxRange FROM t GROUP BY id) s
  WHERE t.id = s.id AND t.range = s.maxRange

请注意,如果存在多个具有最大范围的行的ID,则会丢失重复项。

© www.soinside.com 2019 - 2024. All rights reserved.