我从这张桌子开始
基因 | 样品ID | 时间点 | log2_CPM |
---|---|---|---|
krt19 | 7578 | 14 | 123 |
sftpd1 | 7578 | 14 | 32 |
Cxcl13 | 7578 | 14 | 365 |
krt19 | 7458 | 14 | 125 |
sftpd1 | 7458 | 14 | 36 |
Cxcl13 | 7458 | 14 | 330 |
我需要转换成这样的
样品ID | 时间点 | krt18 | sftpd1 | Cxcl13 |
---|---|---|---|---|
7578 | 14 | 123 | 32 | 365 |
7458 | 14 | 125 | 36 | 330 |
有人可以帮我生成一个 R 代码吗?谢谢
我尝试手动完成并使用 R 代码。没有一个起作用。这是一个非常大的数据集,我将不胜感激。
formattedDATA <-dcast(setDT(rawDATA), formula = c("Timepoint","SampleID") ~ Gene)
ERROR
> formattedDATA <-dcast(setDT(rawDATA), formula = c("Timepoint","SampleID") ~ Gene)
Using 'log2_CPM' as value column. Use 'value.var' to override
Error in vapply(X = x, FUN = fun, ..., FUN.VALUE = NA_character_, USE.NAMES = use.names) :
values must be length 1,
but FUN(X[[1]]) result is length 0
回答
格式化数据<-dcast(setDT(rawDATA), formula = SampleID + Timepoint ~ Gene , value.var = "log2_CPM")