如何使用fasta文件而不是biopython中的蛋白质序列字符串创建多个序列比对

问题描述 投票:0回答:1

我希望能够使用与脚本相同的目录中下载的文件编写多个序列比对。但是,在《 Biopython Cookbook》中,显示此问题的唯一方法是通过写出字符串而不是加载文件。我希望能够做到后者。这是在Chapter 6.2 of The biopython cookbook中进行多序列比对的方法

from Bio.Seq import Seq
from Bio.SeqRecord import SeqRecord
from Bio.Align import MultipleSeqAlignment

align1 = MultipleSeqAlignment([
             SeqRecord(Seq("ACTGCTAGCTAG", generic_dna), id="Alpha"),
             SeqRecord(Seq("ACT-CTAGCTAG", generic_dna), id="Beta"),
             SeqRecord(Seq("ACTGCTAGDTAG", generic_dna), id="Gamma"),
         ])

目标是使用它来从所有蛋白质序列中制成门状树。

我希望能够使用与脚本相同的目录中下载的文件编写多个序列比对。但是,在《 Biopython Cookbook》中,显示此内容的唯一方法是通过编写...

python bioinformatics biopython fasta sequence-alignment
1个回答
0
投票

该示例使用三个SeqRecord对象,这些对象是使用提供的DNA字符串创建的。 SeqIO.parse使您可以读取文件,例如fasta格式并返回SeqRecord对象以进行对齐。

© www.soinside.com 2019 - 2024. All rights reserved.