将每个大矩阵的每个单元除以其行的总和

Question

我有一个物种矩阵的网站。尺寸为375 x 360.每个值代表该场地样本中物种的频率。

我试图将这个矩阵从频率转换为每个站点的相对丰度。

我已经尝试了几种方法来实现这一点，唯一有效的方法是使用for循环。然而，这需要相当长的时间或完全没有完成。

是否有功能或矢量化方法来实现这一目标？我把我的for循环作为我想要做的一个例子。

relative_abundance <- matrix(0, nrow= nrow(data_wide),
ncol=ncol(data), dimnames = dimnames(data))

i=0
j=0

for(i in 1:nrow(relative_abundance)){
  for(j in 1:ncol(relative_abundance)){
    species_freq <- data[i,j]
    row_sum <- sum(data[i,])
    relative_abundance[i,j] <- species_freq/row_sum
 }
}

Answer 1

你可以使用apply做到这一点，但在这种情况下scale使事情变得更加简单。假设您想要按列总和来划分列：

set.seed(0)
relative_abundance <- matrix(sample(1:10, 360*375, TRUE), nrow= 375)

freqs <- scale(relative_abundance, center = FALSE, 
               scale = colSums(relative_abundance))

矩阵太大而不能在这里输出，但这里应该是这样的：

> head(freqs[, 1:5])
            [,1]         [,2]        [,3]        [,4]         [,5]
[1,] 0.004409603 0.0014231499 0.003439803 0.004052685 0.0024026910
[2,] 0.001469868 0.0023719165 0.002457002 0.005065856 0.0004805382
[3,] 0.001959824 0.0018975332 0.004914005 0.001519757 0.0043248438
[4,] 0.002939735 0.0042694497 0.002948403 0.002532928 0.0009610764
[5,] 0.004899559 0.0009487666 0.000982801 0.001519757 0.0028832292
[6,] 0.001469868 0.0023719165 0.002457002 0.002026342 0.0009610764

并进行健全检查：

> head(colSums(freqs))
[1] 1 1 1 1 1 1

使用apply：

freqs2 <- apply(relative_abundance, 2, function(i) i/sum(i))

这样做的好处是可以轻松地将其更改为按行运行，但结果将以列的形式连接，因此您必须对其进行转置。

Answer 2

使用一些简单的线性代数，我们可以产生更快的结果。只需在左侧乘以对角矩阵，并使用您需要的缩放系数，如下所示：

library(Matrix)
set.seed(0)
relative_abundance <- matrix(sample(1:10, 360*375, TRUE), nrow= 375)
Diagonal_Matrix <- diag(1/rowSums(relative_abundance))

然后我们从左边乘以：

row_normalized_matrix <- Diagonal_Matrix %*% relative_abundance

如果要按列标准化，只需：

Diagonal_Matrix <- diag(1/colSums(relative_abundance))

并从右边相乘。

Answer 3

首先，你可以做到

relative_abundance[i,j] <- data[i,j]/sum(data[i,])

所以你不要创建变量......

但是为了矢量化它，我建议：用rowum函数（快速）计算行和，然后你可以使用apply by columns，每个除以rowsums：

 relative_freq<-apply(data,2,function(x) data[,x]/rowsum(data))

Answer 4

你可以做这样的事情

relative_abundance <- matrix(sample(1:10, 360*375, TRUE), nrow= 375)
datnorm <- relative_abundance/rowSums(relative_abundance)

如果relative_abundance是矩阵而不是data.frame，这将更快

将每个大矩阵的每个单元除以其行的总和

问题描述投票：5回答：4

4个回答

最新问题

将每个大矩阵的每个单元除以其行的总和

问题描述 投票：5回答：4

4个回答

最新问题

问题描述投票：5回答：4