R:对矩阵中的元素求和至阈值

问题描述 投票:0回答:1

我有一个包含数千行和几十列的值矩阵。对于给定的行,$$ R_0 $$,我想找到所有其他互补行。互补行定义为:

  1. 如果给定行的列具有非零值,则补码必须具有该列的零值
  2. 给定行及其补码的元素总和必须小于1.0

为了说明,这是一个玩具矩阵:

     [,1]     [,2]      [,3]      [,4]      [,5]      [,6]
[1,] 0         0        0         0.1816416 0         0.1796779
[2,] 0.1889351 0        0         0         0         0        
[3,] 0         0        0.1539683 0         0         0.1983812
[4,] 0         0.155489 0.1869410 0         0         0        
[5,] 0         0        0         0         0.1739382 0        

对于第1行,第4列和第6列有值。第4列和第6列的互补行必须为“0”。

我不知道我想要的输出应该是什么数据结构。但我知道输出应该告诉我:

  • 第1行具有以下互补行:2,3,5
  • 第2行具有以下互补行:1,3,4,5
  • 第3行具有以下互补行:2,5
  • 第4行具有以下互补行:1,2,5
  • 第5行具有以下互补行:1,2,3,4

也许列表清单?即:

[1: 2, 3, 5;
 2: 1, 3, 4, 5;
 3: 2, 5;
 4: 1, 2, 5;
 5: 1, 2, 3, 4]

但我对其他数据结构持开放态度。

以下代码生成上面的玩具矩阵。

set.seed(1)
a = runif(n=30, min=0, max=0.2)
a[a<0.15] = 0
A = matrix(a,              # the data elements 
           nrow=5,         # number of rows 
           ncol=6,         # number of columns 
           byrow = TRUE)   # fill matrix by rows

是否有一个包或巧妙的方法来解决这个问题?

r
1个回答
2
投票

我们可以创建一个函数来检查两行的组合是否是一种恭维

check_compliment <- function(x, y) {
  all(A[y, A[x,] != 0] == 0) & sum(c(A[x, ], A[y, ])) < 1
}

在这里,我们为y不为0的列子集行x,并检查它们的all是否为0.还要检查sumx行的y是否小于1。

使用outer为每个组合应用此功能

sapply(data.frame(outer(1:nrow(A), 1:nrow(A), Vectorize(check_compliment))), which)

#$X1
#[1] 2 4 5

#$X2
#[1] 1 3 4 5

#$X3
#[1] 2 5

#$X4
#[1] 1 2 5

#$X5
#[1] 1 2 3 4

outer step为每行的每个组合提供TRUE / FALSE值,表示它是否是一个恭维

outer(1:nrow(A), 1:nrow(A), Vectorize(check_compliment))
#      [,1]  [,2]  [,3]  [,4]  [,5]
#[1,] FALSE  TRUE FALSE  TRUE  TRUE
#[2,]  TRUE FALSE  TRUE  TRUE  TRUE
#[3,] FALSE  TRUE FALSE FALSE  TRUE
#[4,]  TRUE  TRUE FALSE FALSE  TRUE
#[5,]  TRUE  TRUE  TRUE  TRUE FALSE

我们将其转换为数据框并使用which获取每列的索引。

© www.soinside.com 2019 - 2024. All rights reserved.