FASTA是用于蛋白质和核酸的序列比对的软件包。 FASTA也是这些程序用来表示肽或核苷酸序列的文件格式的名称。该格式是生物信息学中事实上的标准。
上周我决定尝试Perl6并开始重新实现我的一个程序。我不得不说,Perl6对于对象编程来说非常简单,这在Perl5中对我来说非常痛苦。我......
我有一个带有两个模式的标题的fasta文件,例如> 256_Org1 MAVVIIKDAADDSLARRD> Org2_10005 DSLARRDMAVVIIKDAA我想只保留单词并删除数字。我试着用......
如何从序列中删除'> gi | 2765658 | emb | Z78533.1 | CIZ78533 C.irapeanum 5.8S rRNA基因和ITS1和ITS2 DNA \ n'等ID?我有这个代码:open('sequence.fasta','r')为f:...
我有基因序列文件,我想改变每个基因的标题。这是输入:> lcl | CP000046.1_cds_AAW37389.1_1 [gene = dnaA] [locus_tag = SACOL0001] [蛋白质=染色体复制...
我在下面有这个perl脚本来计算序列长度及其频率以及核苷酸频率(A,T,G和C)。此脚本适用于具有大量序列的文件,但它...
我试图使用python在两个单独的文件中找到感兴趣的四行块,然后按受控顺序打印出一些这些行。下面是两个输入文件和一个例子......
我想帮助弄清楚如何在.txt文件中只打印出给定数量的行。我创建了一个带有2个输入参数的函数文件(x,y),第一个'x'是文件,...
如何在我对使用python感兴趣的上下文后打印两行。 Example.fastq @ read1 AAAGGCTGTACTTCGTTCCAGTTG +'(''%$'))%**)2 +'。(&&'/ 5- @ read2 CTGAGTTGAGTTAGTGTTGACTC +)(+ - 0 -...
我有一个由两行组成的字符序列的文本文件:一个标题,以及下一行中的序列本身。该文件的结构如下:> header1 aaaaaaaaa> header2 ...