Hive 中的特定列不同

问题描述 投票:0回答:2

我正在运行 Hive 071。 我有一个表,有多行,具有相同的列值。

 x | y |
---------
 1 | 2 |
 1 | 3 |
 1 | 4 |
 2 | 2 |
 3 | 2 |
 3 | 1 |

我想让 x 列唯一,并删除具有相同 x 值的行;

 x | y |
---------
 1 | 2 |
 2 | 2 |
 3 | 2 |

 x | y |
---------
 1 | 4 |
 2 | 2 |
 3 | 1 |

都很好。

由于 Distinct 仅适用于 Hive 中的整行,因此我找不到方法来做到这一点。

unique distinct hive
2个回答
4
投票

您可以使用distinct关键字:

SELECT DISTINCT x FROM table

2
投票

尝试以下查询以获得结果:

从(选择x,y,rank()上选择A.x,A.y(按x顺序按y分区)从测试g中排名)A,其中排名= 1;

© www.soinside.com 2019 - 2024. All rights reserved.