Biopython是一套免费提供的用Python编写的生物计算工具。请仅将此标记用于与Biopython工具套件相关的问题。
你好,我有一个序列,例如:record_dict = SeqIO.to_dict(SeqIO.parse(“ sequence.fasta”,“ fasta”))> sequence1 AAACCCGGGTTTAAACCCGGGGGTGTGGGTTTGGG,从这个序列中我知道如何选择...
来自BioPython的Align.PairwiseAligner()的MemoryError
我正在尝试编写一个Python3脚本,该脚本执行两个序列的全局比对,序列的长度分别为〜10 kb和11 kb。两者彼此非常相似。 (我正在尝试找出它们的几个点...
我是在生物实验室工作的自学成才的程序员(基本基础上只有一节课)。我有一个脚本处理来自两种不同细胞类型的RNAseq数据,如果在另一个...
Biopython:是否可以从PDB文件中提取特定链的氨基酸序列?
我想从一堆PDB文件中提取特定链的单字母氨基酸序列。我可以使用SeqIO.parse()来做到这一点,但在我看来,这感觉很不合常规:...
我收到错误:pip install biopython SyntaxError:无效的语法
参考资料,学习如何使用Bash和/或Biopython管理表格数据(来自BLAST + 6格式)
我正在运行BLAST,并希望使用BLAST + 6格式处理输出。例如,我想获取每个匹配的E值,查询覆盖率和身份,然后将其插入...
我有一份要订购的DNA寡核苷酸列表,这些寡核苷酸具有重复序列。但是,我需要将它们与标识符搭配使用,以用于它们的质粒。换句话说,我需要这个...
我有一些蛋白质,我希望找到它们的相应核苷酸序列。我也有发现蛋白质的基因组。在基因组中,我发现了...
我想在csv中放入序列列表,但是所有内容都以“ seq('DNA sequence')”的形式返回。如何仅打印NT序列。引物= [Seq(“ CCGCGTTACATAGCATCGTACGCGTACG”),Seq(“ ...
我们有2个DNA序列(字符串):> 1 ATGCAT 135198> 2 ATCAT预期输出:首先,我们需要对齐这2个字符串,然后按索引获取相关注释:ATGCAT AT-CAT 13-198第一部分...
是否有在Biopython中使用PhyML和智能模型选择的方法?
现在,我正在寻找在Biopython中结合使用PhyML和智能模型选择的方法。根据PhyML的官方文献(SMS:PhyML中的智能模型选择:https://academic.oup.com/mbe/article / ...
当我写这行代码时:从src.alphabets导入Uniprot21我遇到了问题:没有名为src.alphabet的模块,我该如何解决?我使用python 3.7
我是INTRO数据科学课程的MPH学生,并且具有编程的初学者知识。我正在运行Python 3.7.4(默认,2019年8月9日,18:34:13)[MSC v.1915 64位(AMD64)] :: Anaconda,...
Biopython:如何下载NCBI中的所有肽序列(或与特定术语相关的所有记录)?
我想以fasta格式下载NCBI蛋白质数据库中的所有肽序列(即>和肽名称,后接肽序列),我看到有一个MESH术语描述了什么……]]
使用bioentrez提取从Pubmed ID公开发布的文章标题
[我正在尝试使用Pubmed ID(我在名为'ids'的列表中拥有)来提取存放在Pubmed中的某些文章的标题。大约有65万个Pubmed ID。该代码似乎可以正常工作,并且不能...
如何有效地读取大型XML文件并创建自定义对象? (Biopython SeqIO)
我正在编写一个程序,该程序从UniProt提取一个充满蛋白质序列的大型XML文件,并对它们进行分析。我已经有一个工作版本,但是是用于较小的文件。我现在需要加载...
最简单的方法是修剪或填充一组biopython fastfa文件,直到它们都具有一定长度,以便可以将它们添加到多序列比对中? BioPython AlignIO ValueError说...
如何使用fasta文件而不是biopython中的蛋白质序列字符串创建多个序列比对
我希望能够使用与脚本相同的目录中下载的文件编写多个序列比对。但是,在《 Biopython Cookbook》中,显示此内容的唯一方法是通过编写...
如何使用fastfa文件而不是biopython中的蛋白质序列字符串创建多个序列比对
我希望能够使用与脚本相同的目录中下载的文件编写多个序列比对。但是,在《 Biopython Cookbook》中,显示此内容的唯一方法是通过编写...