我想在 plink 中按家庭 ID 拆分我的床、bim 和 fam 文件。 例如,我可以通过键入以下内容通过染色体来完成此操作:
p-link --bfile datafile1 --chr 1 --make-bed --out datafile2
这就为 1 号染色体创建了一个单独的床、bim 和 fam 文件。
但是,在我的家庭文件中,我有几个不同的家庭 ID,我想根据它们来分割文件。例如
Family 1 TS11339 0 0 2 -9
Family 1 TS11233 0 0 2 -9
Family 2 TF99288 0 0 2 -9
Family 2 YJ22997 0 0 2 -9
Family 3 YF00277 0 0 2 -9
Family 3 YY92779 0 0 2 -9
我想要 Family1.bed -.bim 和 -.bam,Family2.bed -.bim 和 -.bam 等
我该怎么做? (抱歉知识贫乏 - 刚刚开始使用 plink)。
以下命令应在 UNIX shell 上拆分 plink 数据集:
for fam in $(awk '{print $1}' datafile1.fam | sort | uniq); do echo $fam | plink --bfile datafile1 --keep-fam /dev/stdin --make-bed --out $fam; done
更简单一点:plink --keep-fam .
我明白了,你可以通过 plink 来完成,如下所示:
p-link --bfile datafile1 --keep LIST1.txt --make-bed --out
其中 LIST1.txt 是家庭 ID 和个人的列表。所以说,如果您想提取 Family 1,LIST1.txt 将包含:
家庭1 TS11339
家庭1 TS11233
更多信息可以在plink网站上找到。