将变量与r中的多个变量关联

问题描述 投票:0回答:1

我需要将一个基因与47,000个其他基因相关以找到10条最佳相关曲线。通常,我的数据框的第一列为基因名称,第二列为患者数据,第一行为基因名称。我是否需要转置数据帧以进行相关性测试?如果我换位,它可以工作,但是我相信有一种更简单的方法。有人可以帮我吗?

enter image description here

pancreas_final <- read_delim("path", delim = "\t")
pancreas_final_t <- t(pancreas_final[,-1])
pancreas_final_t <- as.data.frame(pancreas_final_t)
names(pancreas_final_t) <- pancreas_final$X1
class(pancreas_final_t)
View(pancreas_final_t)

vec_cor <- cor(pancreas_final_t$CAMP, pancreas_final_t)
df_cor <- data_frame(gene = attributes(vec_cor)$dimnames[[2]], cor = c(vec_cor))
str(df_cor)

library(tidyverse)

df_cor %>%
  arrange(cor)

df_cor %>%
  arrange(desc(cor)) %>% 
  head(n = 1)
r correlation
1个回答
0
投票

[如果要计算基因之间的相关性(数据行中的行),则需要转置数据框,请尝试此操作以获取基因之间的相关性

correlation_btw_genes = cor(pancreas_final_t)

[如果不转置数据框,cor()函数将计算患者之间的相关性

© www.soinside.com 2019 - 2024. All rights reserved.