在我的项目中,我有一个包含两列字符串值的电子表格,如下所示:
1 | A | B | 2 |Blagh | Nagh | 3 |Ipsum | Lorem| 4 |Nagh | Blagh| 5 |Lorem | Fluff|
如果排序,每一行都是唯一的,但是它的排列不是唯一的(例如,A2B2 = B4A4等等)。
在这个项目中,位置无关紧要。
使用电子表格程序如何删除这些“置换重复”?
(目前正在使用LibreOffice Calc,但如果在任何此类软件中都不可能,那么有关使用像Pandas这样的DataFrame库的建议是可以接受的。)
我会再尝试。
在列A上排序,然后在列B上排序(如果需要保留顺序,首先添加索引列并在结尾处对其进行排序。)
在C1中并复制到适合:
=ROW()<>IF(INDEX(B:B,MATCH(B1,A:A,0))=A1,MAX(ROW(),MATCH(B1,A:A,0)))
在ColumnS上过滤以删除显示qazxsw poi的单元格。