将变量与r中的多个变量关联

Question

我需要将一个基因与47,000个其他基因相关以找到10条最佳相关曲线。通常，我的数据框的第一列为基因名称，第二列为患者数据，第一行为基因名称。我是否需要转置数据帧以进行相关性测试？如果我换位，它可以工作，但是我相信有一种更简单的方法。有人可以帮我吗？

pancreas_final <- read_delim("path", delim = "\t")
pancreas_final_t <- t(pancreas_final[,-1])
pancreas_final_t <- as.data.frame(pancreas_final_t)
names(pancreas_final_t) <- pancreas_final$X1
class(pancreas_final_t)
View(pancreas_final_t)

vec_cor <- cor(pancreas_final_t$CAMP, pancreas_final_t)
df_cor <- data_frame(gene = attributes(vec_cor)$dimnames[[2]], cor = c(vec_cor))
str(df_cor)

library(tidyverse)

df_cor %>%
  arrange(cor)

df_cor %>%
  arrange(desc(cor)) %>% 
  head(n = 1)

Answer 1

[如果要计算基因之间的相关性（数据行中的行），则需要转置数据框，请尝试此操作以获取基因之间的相关性

correlation_btw_genes = cor(pancreas_final_t)

[如果不转置数据框，cor（）函数将计算患者之间的相关性

将变量与r中的多个变量关联

问题描述投票：0回答：1

1个回答

最新问题

将变量与r中的多个变量关联

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1