我对R有点陌生,在这个网站上找了很多帮助,但我还不能准确地找到我想要的东西。假设我有以下的数据(这个例子并不详尽,因为我的实际df大约有2000多行)。
ID "A" "B"
1 11-18-17 1
2 10-10-10 1
3 07-02-96 1
4 01-13-20 2
5 02-01-98 2
6 03-04-64 1
7 11-13-84 1
8 11-07-20 2
其中A列充满了日期,B列只有数字(这不是一个虚拟变量)。我想做一个列C,只有当列B中存在2的时候,列A中的日期才会被填充。
ID "A" "B" "C"
1 11-18-17 1
2 10-10-10 1
3 07-02-96 1
4 01-13-20 2 01-13-20
5 02-01-98 2 02-01-98
6 03-04-64 1
7 11-13-84 1
8 11-07-20 2 11-07-20
我希望如果B=2的条件没有达到,那么在C列中就会显示为空白。 谁能给我一些帮助?我将非常感激
只要使用矢量化的 ifelse
通过其他列有条件地赋值。
数据
txt <- 'ID "A" "B"
1 "11-18-17" 1
2 "10-10-10" 1
3 "07-02-96" 1
4 "01-13-20" 2
5 "02-01-98" 2
6 "03-04-64" 1
7 "11-13-84" 1
8 "11-07-20" 2'
df <- read.table(text=txt, header=TRUE)
df
# ID A B
# 1 1 11-18-17 1
# 2 2 10-10-10 1
# 3 3 07-02-96 1
# 4 4 01-13-20 2
# 5 5 02-01-98 2
# 6 6 03-04-64 1
# 7 7 11-13-84 1
# 8 8 11-07-20 2
解决办法
df$C <- with(df, ifelse(B==2, as.character(A), NA_character_))
df
# ID A B C
# 1 1 11-18-17 1 <NA>
# 2 2 10-10-10 1 <NA>
# 3 3 07-02-96 1 <NA>
# 4 4 01-13-20 2 01-13-20
# 5 5 02-01-98 2 02-01-98
# 6 6 03-04-64 1 <NA>
# 7 7 11-13-84 1 <NA>
# 8 8 11-07-20 2 11-07-20
当列'b'等于1时,'c'列中的NA而不是空白应该是例外。空白是一个字符(class("")
返回 "字符"),R不能在同一列中有一个字符和一个日期。希望能帮到你。
library(dplyr)
b = c(1,1,1,2,2,1,1,2)
a = rep("12-13-20", 8)
df <- data.frame(a, b) %>%
mutate(a = as.Date(a, "%m-%d-%y")) %>%
mutate(c = if_else(b == 2, a, NULL))
print(df)
a b c
1 2020-12-13 1 <NA>
2 2020-12-13 1 <NA>
3 2020-12-13 1 <NA>
4 2020-12-13 2 2020-12-13
5 2020-12-13 2 2020-12-13
6 2020-12-13 1 <NA>
7 2020-12-13 1 <NA>
8 2020-12-13 2 2020-12-13