从2个不同的数据帧中划分2列

问题描述 投票:0回答:3

当有多列来自id时,是否有人知道如何从两个不同的数据帧中划分两列?

例:

library(dplyr)
  name <- c('A','A', 
            'B','B')
  month = c("oct 2018", "nov 2018", 
            "oct 2018",  "nov 2018")
  var1 = c("99", "99", 
            "99",  "99")
  value <- seq(1:length(month))
  df1 = data.frame(name, month, var1, value)

  df2 = df1
  df2["var1"] = c("992", "992", "992", "992")
  df2["value"] = c(2, 4, 6, 8)

  df1

  df2

产量

> df1
  name    month var1 value
1    A oct 2018   99     1
2    A nov 2018   99     2
3    B oct 2018   99     3
4    B nov 2018   99     4

> df2
  name    month var1 value
1    A oct 2018  992     2
2    A nov 2018  992     4
3    B oct 2018  992     6
4    B nov 2018  992     8

有没有人知道如何创建一个新的数据框,将df2中的“value”列除以df1的value列?当列数多于当前示例时,也应该使用该方法。

r dplyr
3个回答
1
投票

在基地R,我们可以做merge

df3 <- merge(df1, df2, by = c("name", "month")) 
df3$value <- df3$value.x/df3$value.y
df3
#  name    month var1.x value.x var1.y value.y value
#1    A nov 2018     99       2    992       4   0.5
#2    A oct 2018     99       1    992       2   0.5
#3    B nov 2018     99       4    992       8   0.5
#4    B oct 2018     99       3    992       6   0.5

如果不需要,你可以删除value.xvalue.y列。


1
投票

将两个数据框连接在一起,然后执行除法并删除由连接生成的不需要的列(假设您需要计算value列来替换原始数据帧中的value列)。根据你的需要,你可能需要一个不同的*_join

library(dplyr)
df1 %>% 
  inner_join(df2, by = c("name", "month")) %>% 
  mutate(value = value.x / value.y) %>%
  select(-value.x, -value.y)

赠送:

  name    month var1.x var1.y value
1    A oct 2018     99    992   0.5
2    A nov 2018     99    992   0.5
3    B oct 2018     99    992   0.5
4    B nov 2018     99    992   0.5

0
投票

我们也可以使用data.table进行连接,并通过将'value'列除以另一个数据集中的相应列来创建列'value',同时加入on'name'和'month'

library(data.table)
df3 <- copy(df1)
setDT(df3)[df2, value := value/i.value, on = .(name, month)]
df3
#   name    month var1 value
#1:    A oct 2018   99   0.5
#2:    A nov 2018   99   0.5
#3:    B oct 2018   99   0.5
#4:    B nov 2018   99   0.5
© www.soinside.com 2019 - 2024. All rights reserved.