我有这个文件:
1kg_1_100990624 rs768670248
rs3176861 rs1011842035
imm_12_2853458 rs951444582
1kg_14_80512920 rs902703491
8_41638322 rs56288115
1°列的值不同,而2°列的值始终采用相同的格式。它很长,我想对它进行排序,然后删除所有重复项。我先使用sort -k1 file.txt
,然后使用sort -u file.txt
,但它不会删除重复项。
对于“重复”,我的意思是:
1kg_14_80512920 rs902703491
1kg_14_80512920 rs950301252
在这种情况下,我只取第一行(1kg_14_80512920 rs902703491),然后删除所有其他行(整行,分别为1°和2°的列)。
我该如何解决?