根据带有字母的另一列将值/字母分配给一列

问题描述 投票:0回答:1

我想根据序列用 NAN(零值)分配/替换计数列,或用字母表替换列

熊猫数据框

IDS      sequence                substitute   count 
header1  GCTCAGCTGGCtAGAG          NAN           O
header1  >>>>........<<<<           <            4

预期产出

IDS      sequence                substitute   count 
header1  GCTCAGCTGGCtAGAG        NAN           Nan
header1  >>>>........<<<<          <            4

我尝试了下面链接中给出的代码,但没有运气

根据字符串条件为 pandas 数据框列赋值

我无法按预期改变,我明白了

    ids      sequence         Count count
0  header1  GCTCAGCTGGCtAGAG     0   NaN
1  header1  >>>>.........<<<     0   3

提前谢谢您

pandas replace assign alphabet
1个回答
0
投票

假设您想要将行与 DNA 序列(a/c/g/t 字母)匹配,您可以使用:

m = df['sequence'].str.contains('[acgt]', case=False)
df.loc[m, 'count'] = np.nan

输出:

       IDS          sequence substitute count
0  header1  GCTCAGCTGGCtAGAG        NAN   NaN
1  header1  >>>>........<<<<          <     4
© www.soinside.com 2019 - 2024. All rights reserved.