为什么我的正则表达式不能删除一个fasta标题的一部分

问题描述 投票:0回答:1

我想删除标题中的“>”和“Un_”之间的所有内容

>NW_017859640.1 Esox lucius isolate CL-BC-CA-002 unplaced genomic scaffold, Eluc_V3 Un_scaffold1210

我已经尝试了多次正则表达式迭代。没有任何包含“*”的内容似乎有效

sed 's/^NC_*Eluc_V3 //' 

并使用这种模式

sed 's/NC_*Eluc_V3 //'

我最终想要的是

>Un_scaffold1210
unix fasta
1个回答
1
投票

试试:

sed 's/^>.*Un_/>Un_/'

在这里,我在行的开头搜索>,接着是Un_,然后用>Un_替换这个字符串。

似乎更容易找到你告诉我们你的标记,而不是试图猜测这些标记内应该是什么,就像你想要做的那样。

© www.soinside.com 2019 - 2024. All rights reserved.