Python找到最长的ORF

问题描述 投票:-3回答:1

有人可以给我展示一个简单的解决方案,以解决如何计算DNA序列中最长30bp的最长开放阅读框(ORF)吗? ATG是起始密码子(即ORF的开始),而TAG,TGA和TAA是终止密码子(即ORF的结束)。无需使用BioPython。

python bioinformatics biopython fasta dna-sequence
1个回答
0
投票

此正则表达式可能可以完成这项工作:

ATG(...){30,}(TAG|TGA|TAA)

[(...)是一个三个字母的密码子,它与{30,}匹配30次或更多次,并且只要找到(TAG|TGA|TAA)之一就停止。

此正则表达式可以帮助您找到所有ORF,现在您只需要找到最长的琐碎字符即可。

© www.soinside.com 2019 - 2024. All rights reserved.