使用case_when进行字符串匹配的多种模式

Question

我正在尝试使用str_detect和case_when根据多种模式重新编码字符串，并将每次出现的重新编码值粘贴到新列中。 “正确”列是我要实现的输出。

这类似于this question和this question，如果用case_when无法完成（我认为仅限于一种模式），还有更好的方法可以仍然使用tidyverse吗？

Fruit=c("Apples","apples, maybe bananas","Oranges","grapes w apples","Lemons")
Num=c(1,2,3,4,5)
data=data.frame(Num,Fruit)

df= data %>% mutate(Incorrect=
paste(case_when(
  str_detect(Fruit, regex("apples", ignore_case=TRUE)) ~ "good",
  str_detect(Fruit, regex("bananas", ignore_case=TRUE)) ~ "gross",
  str_detect(Fruit, regex("grapes | oranges", ignore_case=TRUE)) ~ "ok",
  str_detect(Fruit, regex("lemon", ignore_case=TRUE)) ~ "sour",
  TRUE ~ "other"
),sep=","))

  Num                 Fruit Incorrect
  1                Apples      good
  2 apples, maybe bananas      good
  3               Oranges     other
  4       grapes w apples      good
  5                Lemons      sour

 Num                 Fruit    Correct
   1                Apples       good
   2 apples, maybe bananas good,gross
   3               Oranges         ok
   4       grapes w apples    ok,good
   5                Lemons       sour

Answer 1

我们可以将数据放入单独的行，然后为其分配值。

library(dplyr)
library(stringr)

data %>%
  tidyr::separate_rows(Fruit, sep = ",|\\s+") %>%
   mutate(Correct = case_when(str_detect(Fruit, regex("apples", ignore_case=TRUE)) ~ "good",
                         str_detect(Fruit, regex("bananas", ignore_case=TRUE)) ~ "gross",
                         str_detect(Fruit, regex("grapes|oranges", ignore_case=TRUE)) ~ "ok",
                         str_detect(Fruit, regex("lemon", ignore_case=TRUE)) ~ "sour",
                         TRUE ~ NA_character_)) %>% 
   group_by(Num) %>%
   summarise(Correct = toString(na.omit(Correct))) %>%
   left_join(data)

#   Num Correct     Fruit                
#  <dbl> <chr>       <fct>                
#1     1 good        Apples               
#2     2 good, gross apples, maybe bananas
#3     3 ok          Oranges              
#4     4 ok, good    grapes w apples      
#5     5 sour        Lemons

使用case_when进行字符串匹配的多种模式

问题描述投票：1回答：1

1个回答

最新问题

使用case_when进行字符串匹配的多种模式

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1