我试图将数百个转录因子结合位点序列与我的参考序列比对。
例如,在下面的序列中,粗体是它映射到的两个TF结合位点。
CTGGCGCGTGATCAACTGGCCAATCATGGCATCTGTCATTGTGAGTATAACCTCACACCCGTACTTCTAAACACACAGACCAGCCTCATACTGTATGCATTATGTCAGGCAGG GAGGGATTCTGCCAGCAAAGCAGACGAGGGGATGTGCTGAGTCTCACAGACACTTTCCTGGATAAGACATGAATGCAGGCATGTCAGGAAGAGCAAGCAAACACGCTGTCC
当我尝试在snapgene中使用对齐函数时,输出显示TF序列映射到的一个站点。但是,当我手动ctrl + f搜索我的TF序列的匹配时,有两个站点(上面的粗体)与我的序列100%匹配,但它只能通过snapgene自动对齐或制成一个特征用于第一个匹配它遇到的网站,并没有为第二个网站做。我只是想知道是否有任何建议或平台(例如python,R)将多个短序列映射到参考序列,该参考序列能够注释参考序列上所有可能的比对位点?
Bioconductor Biostrings vmatchPDict()
可能在这种情况下运作良好;有关示例,请参阅帮助页面?vmatchPDict
。