我正在运行 Hive 071。 我有一个表,有多行,具有相同的列值。
x | y |
---------
1 | 2 |
1 | 3 |
1 | 4 |
2 | 2 |
3 | 2 |
3 | 1 |
我想让 x 列唯一,并删除具有相同 x 值的行;
x | y |
---------
1 | 2 |
2 | 2 |
3 | 2 |
或
x | y |
---------
1 | 4 |
2 | 2 |
3 | 1 |
都很好。
由于 Distinct 仅适用于 Hive 中的整行,因此我找不到方法来做到这一点。
您可以使用distinct关键字:
SELECT DISTINCT x FROM table
尝试以下查询以获得结果:
从(选择x,y,rank()上选择A.x,A.y(按x顺序按y分区)从测试g中排名)A,其中排名= 1;