需要对一列进行groupby添加以获取Hive中另一列的计数

问题描述 投票:0回答:1

这是我的示例数据:

“输入”

在上表中,我们可以看到a1,a2,a3和a4都具有src1。我只需要a3和a4作为结果,因为它们是仅嵌入了src1的仅有的行。 a1和a2具有其他src2,...,等等。

我需要一个配置单元查询来获取结果。

sql hadoop group-by hive hiveql
1个回答
0
投票

您可以按col1进行聚合,并使用having子句对col1的唯一值为col2'src1'进行过滤。

select col1
from mytable
group by col1
having min(col2) = max(col2) and min(col2) = 'src1'
© www.soinside.com 2019 - 2024. All rights reserved.