如何在R中使用矩阵代数创建新列?

问题描述 投票:0回答:1

我有一个包含多列的数据框。我有另一个数据框,其中有两列,因子和系数。我想在初始数据帧(mydata)中创建一个新列,该列是将mydata(a:e)每行中的每个元素乘以df中的系数(a:e)的总和。 newcol第一行的结果应为64(1 * 1 + 2 * 2 + 3 * 3 + 4 * 4 + 7 * 5)。理想情况下,我将能够以不同的系数以某种方式复制这20多次。


mydata <- data.frame(a = 1:10, b = 2:11, c = 3:12, d = 4:13, d_1 = 5:14, d_2 = 6:15, d_3 = 7:16, e = 8:17)
df <- data.frame(factor = c('a','b','c','d','e'), coefficient = 1:5)

mydata$newcol <- mydata[,c("a","b","c","d","e")] %*% df$coefficient
mydata$newcol2 <- mydata[,c("a","b","c","d_1","e")] %*% df$coefficient

任何建议都会有所帮助!

r dataframe matrix-multiplication
1个回答
0
投票

我们可以在此处使用sweep,基于mydatafactor列的子集df,然后将其与每个元素的coefficient相乘,然后取rowSums来计算总和。

mydata$newcol <- rowSums(sweep(mydata[as.character(df$factor)], 2,df$coefficient, `*`))

mydata
#    a  b  c  d d_1 d_2 d_3  e newcol
#1   1  2  3  4   5   6   7  8     70
#2   2  3  4  5   6   7   8  9     85
#3   3  4  5  6   7   8   9 10    100
#4   4  5  6  7   8   9  10 11    115
#5   5  6  7  8   9  10  11 12    130
#6   6  7  8  9  10  11  12 13    145
#7   7  8  9 10  11  12  13 14    160
#8   8  9 10 11  12  13  14 15    175
#9   9 10 11 12  13  14  15 16    190
#10 10 11 12 13  14  15  16 17    205

或者我们也可以将mydata换位并乘以coefficient并得到colSums

colSums(t(mydata[as.character(df$factor)]) *  df$coefficient)
© www.soinside.com 2019 - 2024. All rights reserved.