我开始使用 GAPIT 进行 GWAS。 这是我在尝试运行时遇到的错误。用我的数据最简单的 GLM:
“[1]“GD 不匹配曼哈顿的 GM!!!”
[.data.frame
(GD, , !is.na(GI.MP[, 3])) 中的错误:
选择了未定义的列
另外: 警告消息:
1:在 rm(eig.L) 中:未找到对象“eig.L”
2:在 merge.data.frame(gs.blup, BLUE, by.x = "Taxa", by.y = "Taxa") 中:
列名‘NA’、‘NA’在结果中重复”
这是我使用的代码:
myY <- read.table("populus_alive_pheno.csv", sep = ";", header = TRUE)
myG <- read.table("populus_test_new1.csv", sep= ";", header = FALSE)
dir.create(file.path(main_dir, "/res"))
setwd(paste(main_dir, "/res", sep=""))
myGAPIT_GLM0 <- GAPIT(
Y = myY[, 1:2],
G = myG,
SNP.MAF = 0.05,
SNP.fraction = 0, ## NO kinship
PCA.total = 0, ## no pop struct
Model.selection = FALSE,
model = "GLM",
Geno.View.output = FALSE ## required when too much SNPs
)
运行此代码后,GAPIT 制作了一些表型统计图,制作了 QQplot 和 Genomewise曼哈顿,但在涉及染色体范围曼哈顿时停止了。
我问我的同事可能是什么问题,他说这个错误是由于基因型文件和表型文件中的样本数量不同而发生的。浏览互联网,我发现同样的情况。 但我检查了我的数据,pheno 文件中有 63 行(样本),基因型文件中有 74 列(11 个必需的 GAPIT 列 + 63 个样本)。
我附上了我的数据集头的屏幕截图,以防它们仍然存在问题。
我和你有同样的问题。你解决这个问题了吗?如果是,您是如何进行的?
谢谢你,
马可