从DataFrame列中匹配字符串

问题描述 投票:0回答:3

我具有如下测试数据帧(原始文件为60 x 350)

Speci 45 46 47 48 49 50 51
   PP  A  T  A  -  G  G  A
   JJ  G  T  A  -  T  A  G
   KK  A  T  -  A  G  -  A
   LL  A  C  A  A  G  G  A
   MM  G  C  A  A  G  G  G
   NN  C  -  G  T  C  C  T

基本上,我想做的是通过输入字符串和列名/数字,如下所示

input string: CAAGGA
ColF (Column from): 46
ColT ( Column To ): 51

并精确匹配每个对应的指定列(从到,并按降序输出最佳匹配,如下所示)>

Species Matchs
LL  6
MM  5
PP  4

我只用于ggplots和基本文件处理的R / Python语言,不确定如何遍历数据框和进行匹配。

[我的测试数据帧如下(原始文件为60 x 350),规格45 46 47 48 49 50 51 PP ATA-GGA JJ GTA-TAG KK AT-AG-LL ACAAGGA ...

python r dataframe string-matching
3个回答
1
投票

0
投票

0
投票
© www.soinside.com 2019 - 2024. All rights reserved.