我成功运行了整个序列比对、SNP 和 INDELS 流程。然而,我想估计识别每个 SNP 的读取频率。我需要频率来正确估计每个 SNP 的准确性。我非常感谢任何专业指导。
我是生物信息学新手,我不知道如何进行这一步。
在 VCF 文件中,此信息通常可在 FORMAT/AD 字段中找到。
##FORMAT=<ID=AD,Number=R,Type=Integer,Description="Allelic depths for the ref and alt alleles in the order listed">