如何通过标签从基因库文件中提取特征?

问题描述 投票:0回答:1

我正在尝试解析genbank文件以查找特定功能。如果我知道特征类型(例如repeat_region),则可以将其拔出-例如,如果我正在寻找此特征:

 repeat_region   5623..5756
                 /label=5' ITR
                 /note="5' ITR"

我知道我可以使用:

for feature in reference.features:
if feature.type == "repeat_region":
    print(feature.location)

但是我不相信它将永远是一个repeat_region。相反,我想按标签(5'ITR)查找它。我似乎可以找到一种从要素对象中进行解析的方法。有什么建议吗?

feature-extraction biopython genbank
1个回答
0
投票

我建议尝试使用ElementTree库;它将把genbank xml文件解析为字典,然后您应该能够将/ label标记作为键来访问。

© www.soinside.com 2019 - 2024. All rights reserved.