从具有字符和数字值的文件中排序并删除重复项

问题描述 投票:0回答:1

我有这个文件:

1kg_1_100990624 rs768670248
rs3176861 rs1011842035
imm_12_2853458 rs951444582
1kg_14_80512920 rs902703491
8_41638322 rs56288115

1°列的值不同,而2°列的值始终采用相同的格式。它很长,我想对它进行排序,然后删除所有重复项。我先使用sort -k1 file.txt,然后使用sort -u file.txt,但它不会删除重复项。

对于“重复”,我的意思是:

1kg_14_80512920 rs902703491
1kg_14_80512920 rs950301252

在这种情况下,我只取第一行(1kg_14_80512920 rs902703491),然后删除所有其他行(整行,分别为1°和2°的列)。

我该如何解决?

shell file sorting unix duplicates
1个回答
1
投票
© www.soinside.com 2019 - 2024. All rights reserved.