如何从公式/字符串中删除两个连续的加号（+）？

Question

例如，我有一个这样的公式：

main_var ~ 0 + var1:x + var2:y + var3 + + var4 + (0 + main_var|x_y) + (0 + add_var|x_y) + (1|x_y)

如何删除var3和var4之间的两个连续的加号（+）（并只留下一个）？

Answer 1

类似

as.formula( gsub( ""\\+s*\\+", "+", deparse(f)))

其中f是您的公式。

Answer 2

可以编辑公式的组成部分而不必强制使用字符串。公式包含两个部分，一个表达式（您编写的部分）和一个环境（您在其中编写的地方，也许在表达式中引用了变量）。我们要坚持的环境；我们要更改的表达式。

表达式（在这里我是指符号和调用之类的语言对象，而不是狭义的expression类）是语法树，其行为有点像列表。它们可以是子集：

f <- main_var ~ 0 + var1:x + var2:y + var3 + + var4 + (0 + main_var|x_y) + (0 + add_var|x_y) + (1|x_y)

f[[1]]
#> `~`
f[[2]]
#> main_var
f[[3]]
#> 0 + var1:x + var2:y + var3 + +var4 + (0 + main_var | x_y) + (0 + 
#>     add_var | x_y) + (1 | x_y)
f[[3]][[3]]
#> (1 | x_y)

因此反复进行。因为它们是树状结构，所以要遍历整个树，我们需要递归。大多数功能对于递归来说都是非常典型的（返回原子叶节点；在带有子节点的节点上递归），但是棘手的部分是确定我们要更改的部分的条件。如果您查看有问题的节点，则该节点包含一元（带有一个参数）的+调用：

f <- main_var ~ 0 + var1:x + var2:y + var3 + + var4 + (0 + main_var|x_y) + (0 + add_var|x_y) + (1|x_y)
f[[3]][[2]][[2]][[2]][[3]]
#> +var4
f[[3]][[2]][[2]][[2]][[3]][[1]]
#> `+`
f[[3]][[2]][[2]][[2]][[3]][[2]]
#> var4

所有其他+调用都是二进制的。因此，我们可以检查第一个节点为+的长度为2的节点。事实证明，获取+表达式也有些棘手。最简单的是experssion(+)[[1]]或quote(+1)[[1]]，但是一旦有了它，相等检查就会照常进行。

将各个部分放在一起，然后通过将各个部分强制返回表达式和公式来进行清理，

remove_unary_plus <- function(expr){
    if (length(expr) == 1) {
        # return atomic elements
        return(expr) 
    } else if (length(expr) == 2 && expr[[1]] == expression(`+`)[[1]]) {
        # for unary plus calls, return the argument without the plus
        return(expr[[2]]) 
    } else {
        # otherwise recurse, simplifying the results back to a language object
        clean_expr <- as.call(lapply(expr, remove_unary_plus))

        # if it's a formula, hold on to the environment
        if (inherits(expr, "formula")) {
            clean_expr <- as.formula(clean_expr, env = environment(expr))
        }

        return(clean_expr)
    }
}

f_clean <- remove_unary_plus(f)
f_clean
#> main_var ~ 0 + var1:x + var2:y + var3 + var4 + (0 + main_var | 
#>     x_y) + (0 + add_var | x_y) + (1 | x_y)

而且，它保持其环境：

str(f)
#> Class 'formula'  language main_var ~ 0 + var1:x + var2:y + var3 + +var4 + (0 + main_var | x_y) +      (0 + add_var | x_y) + (1 | x_y)
#>   ..- attr(*, ".Environment")=<environment: R_GlobalEnv>
str(f_clean)
#> Class 'formula'  language main_var ~ 0 + var1:x + var2:y + var3 + var4 + (0 + main_var | x_y) + (0 +      add_var | x_y) + (1 | x_y)
#>   ..- attr(*, ".Environment")=<environment: R_GlobalEnv>

显然，这对于日常的公式操作来说有点痛苦，但是，很可能，它可能对程序化用法很有用，并且（至少对我而言）很有趣。

如何从公式/字符串中删除两个连续的加号（+）？

问题描述投票：0回答：2

2个回答

最新问题

如何从公式/字符串中删除两个连续的加号（+）？

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2