将图案映射回参考序列中的多个站点

问题描述 投票:-1回答:1

我试图将数百个转录因子结合位点序列与我的参考序列比对。

例如,在下面的序列中,粗体是它映射到的两个TF结合位点。

CTGGCGCGTGATCAACTGGCCAATCATGGCATCTGTCATTGTGAGTATAACCTCACACCCGTACTTCTAAACACACAGACCAGCCTCATACTGTATGCATTATGTCAGGCAGG GAGGGATTCTGCCAGCAAAGCAGACGAGGGGATGTGCTGAGTCTCACAGACACTTTCCTGGATAAGACATGAATGCAGGCATGTCAGGAAGAGCAAGCAAACACGCTGTCC

当我尝试在snapgene中使用对齐函数时,输出显示TF序列映射到的一个站点。但是,当我手动ctrl + f搜索我的TF序列的匹配时,有两个站点(上面的粗体)与我的序列100%匹配,但它只能通过snapgene自动对齐或制成一个特征用于第一个匹配它遇到的网站,并没有为第二个网站做。我只是想知道是否有任何建议或平台(例如python,R)将多个短序列映射到参考序列,该参考序列能够注释参考序列上所有可能的比对位点?

python r alignment bioinformatics
1个回答
2
投票

Bioconductor Biostrings vmatchPDict()可能在这种情况下运作良好;有关示例,请参阅帮助页面?vmatchPDict

© www.soinside.com 2019 - 2024. All rights reserved.