我试图弄清楚如何在不破坏标头的情况下将混合的DNA / RNA multifasta变成仅DNA的格式。我的知识以
结尾sed 's/u/t/g'
但是这显然会影响标题。有没有一种方法可以避免使用sed更改标头,还是应该使用其他命令?我应该找什么?
使用sed
,很容易说“仅在选定的行上执行此操作”。通用语法为地址 命令,其中地址可以是一个正则表达式,仅匹配第一个字符不是>
的行。
sed '/^[^>]/s/u/t/g' file.fasta >newfile.fasta
第一个
^
表示行的开头;字符类[^>]
与不(换行符或)>
的单个字符匹配。