dplyr中的filter（）如何评估自定义函数中（）的内容？

Question

我正在尝试编写一个函数，该函数采用两个列名以及每个列名的上下边界，因此我可以使用自己选择的列名和边界对数据进行子集化。以mtcars为例，如果我想说我只希望cyl> 4和mpg> 15的行作为数据的子集，在这种情况下，我的函数将使用两个列名称cyl和mpg，每列还有两个下边界名称，分别是4和15。当然，在函数中，我可以选择为其分配一个上限，以将列名（变量）保持在一定范围内。因此，我想出了类似下面的内容，该函数接受您选择的两个变量名称以及每个变量的上限和/或下限。如果我仅对此变量给出一个上边界或下边界，那么它将给我小于或大于该边界的任何东西，如果我给函数同时指定上边界和下边界，则它会返回属于该范围的行。

comb_function<-function(df,var1,var2,var1_lower=NULL,var1_upper=NULL,var2_upper=NULL,var2_lower=NULL){
   var1<-enexpr(var1)
   var2<-enexpr(var2)
 #####for var2,if upper boundary are given by user,do this#####{
    filter1<-expr(`$`(df,!!var2))<=var2_upper
    #for var1, if upper boundary are given by user,do this# {
      filter2<-expr(`$`(df,!!var1))<=var1_upper}
    #for var 1,if lower boundary are given by user, do this#{
      filter2<-expr(`$`(df,!!var1))>=var1_lower}
    #for var1, if both are given by user, do this#{
      filter2<-expr(`$`(df,!!var1))>=var1_lower&expr(`$`(df,!!var1))<=var1_upper}
  }
  #####for var2,if lower boundary are given by user,do this#####{
    filter1<-expr(`$`(df,!!var2))>=var2_lower 
    #for var1,if upper boundary are given by user,do this#{
      filter2<-expr(`$`(df,!!var1))<=var1_upper}
    #for var1,if lower boundary are given by user,do this#{
      filter2<-expr(`$`(df,!!var1))>=var1_lower}
    #if both are given by the user,do this{
      filter2<-expr(`$`(df,!!var1))>=var1_lower&expr(`$`(df,!!var1))<=var1_upper}
  }
  #####for var2,if both are given by user,do this#####{
    filter1<-expr(`$`(df,!!var2))<=var2_upper&expr(`$`(df,!!var2))>=var2_lower
    #for var1,if upper boundary are given by user,do this#{
      filter2<-expr(`$`(df,!!var1))<=var1_upper}
    #for var1,if lower boundary are given by user,do this#{
      filter2<-expr(`$`(df,!!var1))>=var1_lower}
    #if both are given by user, do this#{
      filter2<-expr(`$`(df,!!var1))>=var1_lower&expr(`$`(df,!!var1))<=var1_upper}
  }
   output<-df%>%filter(filter1,filter2)%>%summarise(count=n(),avgcyl=mean(cyl,na.rm=TRUE))
    return(output)
}

当我以mtcars为例调用此函数时

final1<-comb_function(df=mtcars,var1=mpg,var2=cyl,var1_lower =15,var2_lower=4,var2_upper=6)

我在final1中得到了0个计数和avgcrl的NaN。因此，当filter()评估()内的内容时，只会得到FALSE，否TRUE，我认为这就是为什么没有行返回的原因。

我有一个理论为什么会这样。如果我这样做：

x<-expr(cyl);eval(expr(expr(`$`(mtcars,!!x))<=6))

返回：

[1]FALSE

这显然不是我期望的。如果我这样做：

eval(expr(`$`(mtcars,!!x)))<=6

返回

[1]  TRUE  TRUE  TRUE  TRUE FALSE  TRUE FALSE  TRUE  TRUE  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE  TRUE  TRUE FALSE
[23] FALSE FALSE FALSE  TRUE  TRUE  TRUE FALSE  TRUE FALSE  TRUE

这是我要在函数内部使用filter()函数的功能。所以我猜想当filter()评估()的内容时，它会自动将整个表达式放在方括号内，就像

eval(expr(expr(`$`(mtcars,!!x))<=6))

did，仅返回一个FALSE。因此，如果这真的是我期望的原因，那么如何让filter()知道我真正想要的是要像这样进行评估：

eval(filter1<-expr(`$`(df,!!var2)))<=var2_upper

不是这个：

eval(filter1<-expr(`$`(df,!!var2))<=var2_upper)

如果我猜不是正在发生的事情，请也帮助我。

Answer 1

@@ Lionel Henry谢谢！我对您的示例确实有后续问题。

dplyr中的filter（）如何评估自定义函数中（）的内容？

问题描述投票：0回答：2

2个回答

最新问题

dplyr中的filter（）如何评估自定义函数中（）的内容？

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2