我在学习过程中使用data.table
并试图通过b
重新编码NA的非缺失值。
library(data.table)
dt <- data.table(a = rep(1:3, 2),
b = c(rep(1,3), rep(2, 3)),
c = c(NA, 4, NA, 6, NA, NA))
> dt
a b c
1: 1 1 NA
2: 2 1 4
3: 3 1 NA
4: 1 2 6
5: 2 2 NA
6: 3 2 NA
我希望得到这样的:
> dt
a b c
1: 1 1 4
2: 2 1 4
3: 3 1 4
4: 1 2 6
5: 2 2 6
6: 3 2 6
我尝试了这些,但没有给出期望的结果。
dt[, c := ifelse(is.na(c), !is.na(c), c), by = b]
dt[is.na(c), c := dt[!is.na(c), .(c)], by = b]
欣赏得到一些帮助和我应该怎么考虑一点点解释/想尝试解决data.table
方法的问题时。
假设一个简单情况是c
的每个级别只有一个b
:
dt[, c := c[!is.na(c)][1], by = b]
dt