我想读一下基因组特定区域的所有调用。无论基因型如何(等于参考基因组或替代,编码或非编码区)。假设所有基因组都被测序。我应该看一下下表中的哪一个?
我正在使用Google BigQuery基因组数据,需要解释以下文件扩展名之间的差异:* .genome_calls * .variants * .multisample_variants * .single_sample_genome_calls
非常感谢,Eila
genome_calls - 所有基因组调用 - 不仅是变体。可能有低质量的电话
multisample_variants - 样本变体 - 其中每个变体将包含在一个变体行中包含此变异的所有样本
single_sample_genome_calls - 样本矩阵的变体。存在于多个样本中的变体每个样本将有一行