是否有相同的dplyr
这样做?我在'替换所有'匹配字符串xxx与NA之后
is.na(df) <- df=="xxx"
我想使用从R到Spark数据帧的管道函数执行sparklyr
命令
tbl(sc,"df") %>%
并坚持上面的第一个脚本不起作用。
将“XXX”替换为您要查找的字符串:
#Using dplyr piping
library(dplyr)
df[] = df %>% lapply(., function(x) ifelse(grepl("XXX", x), NA, x))
#Using only the base package
df[] = lapply(df, function(x) ifelse(grepl("XXX", x), NA, x))
此方法逐个评估数据框中的每一列,并应用该函数查找“XXX”并将其替换为NA。