我需要将一个基因与47,000个其他基因相关以找到10条最佳相关曲线。通常,我的数据框的第一列为基因名称,第二列为患者数据,第一行为基因名称。我是否需要转置数据帧以进行相关性测试?如果我换位,它可以工作,但是我相信有一种更简单的方法。有人可以帮我吗?
pancreas_final <- read_delim("path", delim = "\t")
pancreas_final_t <- t(pancreas_final[,-1])
pancreas_final_t <- as.data.frame(pancreas_final_t)
names(pancreas_final_t) <- pancreas_final$X1
class(pancreas_final_t)
View(pancreas_final_t)
vec_cor <- cor(pancreas_final_t$CAMP, pancreas_final_t)
df_cor <- data_frame(gene = attributes(vec_cor)$dimnames[[2]], cor = c(vec_cor))
str(df_cor)
library(tidyverse)
df_cor %>%
arrange(cor)
df_cor %>%
arrange(desc(cor)) %>%
head(n = 1)
[如果要计算基因之间的相关性(数据行中的行),则需要转置数据框,请尝试此操作以获取基因之间的相关性
correlation_btw_genes = cor(pancreas_final_t)
[如果不转置数据框,cor()函数将计算患者之间的相关性