如何将字符串中的表达式传递给dplyr 0.7.2中的动词

问题描述 投票:4回答:1

我正在尝试实施我在网上找到的建议,但我已经到了想要去的地方。

这是一个可重复的例子:

library(tidyverse)
library(dplyr)
library(rlang)

data(mtcars)

filter_expr = "am == 1"

mutate_expr = "gear_carb = gear*carb"

select_expr = "mpg , cyl"

mtcars %>% filter_(filter_expr) %>% mutate_(mutate_expr) %>% select_(select_expr)

过滤器表达式工作正常。

mutate表达式也可以工作,但新变量的名称为gear_carb = gear * carb而不是预期的gear_carb。

最后,select表达式返回一个异常。

您的建议将不胜感激。

r dplyr rlang
1个回答
3
投票

正如评论中所提到的,dplyr动词的下划线版本现已弃用。现在正确的方法是使用quasiquotation

要使用select解决您的问题,您只需修改select_expr以包含多个表达式:

## I renamed your variables to *_str because they are, well, strings.
filter_str <- "am == 1"
mutate_str <- "gear_carb = gear*carb"
select_str <- "mpg; cyl"                # Note the ;

接下来,我们使用rlang::parse_expr将这些字符串转换为未评估的表达式:

filter_expr <- rlang::parse_expr( filter_str )
# am == 1
mutate_expr <- rlang::parse_expr( mutate_str )
# gear_carb = gear * carb

## Notice the plural parse_exprs, which parses a list of expressions
select_expr <- rlang::parse_exprs( select_str )
# [[1]]
# mpg
#
# [[2]]
# cyl

鉴于未评估的表达式,我们现在可以将它们传递给dplyr动词。但是,动词本身会将其参数捕获为未评估的表达式(称为“引用”的动作)。例如,filter( filter_expr )将捕获filter_expr作为未评估的表达。但是,我们不希望表达式filter_expr本身;我们想要已经存储在名为am == 1的变量中的表达式filter_expr

为了防止这种“双引号”(即创建第二级无价值),我们使用!!运算符让dplyr动词知道参数已包含未评估的表达式:

mtcars %>% filter( !!filter_expr )
#     mpg cyl  disp  hp drat    wt  qsec vs am gear carb
# 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
# 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
# 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1
# 4  32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1

mtcars %>% mutate( !!mutate_expr )
#     mpg cyl  disp  hp drat    wt  qsec vs am gear carb gear_carb = gear * carb
# 1  21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4                      16
# 2  21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4                      16
# 3  22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1                       4
# 4  21.4   6 258.0 110 3.08 3.215 19.44  1  0    3    1                       3

select的情况下,我们有多个表达式,由!!!处理:

mtcars %>% select( !!!select_expr )
#                      mpg cyl
# Mazda RX4           21.0   6
# Mazda RX4 Wag       21.0   6
# Datsun 710          22.8   4

附:还值得一提的是选择助手one_of,它允许用户直接使用字符串,而不必首先使用rlang::parse_expr()

mtcars %>% select( one_of( "mpg", "cyl" ) )
#                      mpg cyl
# Mazda RX4           21.0   6
# Mazda RX4 Wag       21.0   6
# Datsun 710          22.8   4
© www.soinside.com 2019 - 2024. All rights reserved.