我正在尝试解析genbank文件以查找特定功能。如果我知道特征类型(例如repeat_region),则可以将其拔出-例如,如果我正在寻找此特征:
repeat_region 5623..5756
/label=5' ITR
/note="5' ITR"
我知道我可以使用:
for feature in reference.features:
if feature.type == "repeat_region":
print(feature.location)
但是我不相信它将永远是一个repeat_region。相反,我想按标签(5'ITR)查找它。我似乎可以找到一种从要素对象中进行解析的方法。有什么建议吗?
我建议尝试使用ElementTree库;它将把genbank xml文件解析为字典,然后您应该能够将/ label标记作为键来访问。