如何在函数内安全地将惰性对象导出到函数中的工作人员?

问题描述 投票:0回答:1

我在函数

f
中有一个函数
g
,它首先操纵来自
lm
lme4::lmer
lmerTest::lmer
的调用,然后重新执行它。
eval
将使用
f
(类型 1)或
g
(类型 2)、
R
(类型 3)重复
vapply
mclapply
次。
parSapply

虽然使用 
g <- \(fit, type=1, R=2L, nc=2L) { f <- \(...) { ## f manipulates call if (inherits(fit, 'lmerMod')) { cl <- fit@call ## manipulate... lme4::fixef(eval(cl, envir=fenv)) } else { cl <- fit$call ## manipulate... eval(cl, envir=fenv)$coe } } fenv <- new.env() environment(f) <- fenv if (type == 1) { ## rep. using `vapply` bc <- vapply(seq_len(R), f, numeric(ncol(model.matrix(fit)))) } else if (type == 2) { ## rep. using `mclapply` bc <- parallel::mclapply(seq_len(R), f, mc.cores=nc) |> do.call(what='cbind') } else if (type == 3) { ## rep. using `parSapply` .CL <- parallel::makeCluster(nc) on.exit(parallel::stopCluster(.CL)) parallel::clusterExport(.CL, c('fit'), envir=fenv) bc <- parallel::parSapply(.CL, seq_len(R), f) } else stop('type undefined') return(bc) }

vapply
总是有效,但使用
mclapply
总是失败。不幸的是,
parSapply
正是我目前所依赖的。还注意到使用
parSapply
lm
lme4::lmer
时的差异。此外,我需要将公式作为对象提供,这使事情变得复杂。
所以,首先是

lmerTest::lmer

案例。
lm

接下来是 
fo1 <- mpg ~ cyl g(lm(fo1, mtcars), type=1) ## works g(lm(fo1, mtcars), type=2) ## works # [,1] [,2] # (Intercept) 37.88458 37.88458 # cyl -2.87579 -2.87579 g(lm(fo1, mtcars), type=3) ## fails # Error in checkForRemoteErrors(val) : # 2 nodes produced errors; first error: object 'fo1' not found

案例,它们的失败情况不同。
lme4::lmer/lmerTest::lmer

data('sleepstudy', package='lme4')
sleepstudy$foo <- 0 ## to keep promise
    
fo2 <- Reaction ~ Days + (1 | Subject)

g(lme4::lmer(fo2, sleepstudy), type=1)  ## works
g(lme4::lmer(fo2, sleepstudy), type=2)  ## works
#                  [,1]      [,2]
# (Intercept) 251.40510 251.40510
# Days         10.46729  10.46729

g(lme4::lmer(fo2, sleepstudy), type=3)  ## fails
# Error in checkForRemoteErrors(val) :
#  2 nodes produced errors; first error: bad 'data': object 'sleepstudy' not 
#  found

g(lmerTest::lmer(fo2, sleepstudy), type=1)  ## works
g(lmerTest::lmer(fo2, sleepstudy), type=2)  ## works
g(lmerTest::lmer(fo2, sleepstudy), type=3)  ## fails
# Error in checkForRemoteErrors(val) :
#  2 nodes produced errors; first error: object 'fo2' not found

lm
一致认为找不到公式,而
lmerTest::lmer
找不到
lme4::lmer
最后,明确指定公式时的 

sleepstudy

变体。
parSapply

g(lm(mpg ~ cyl, mtcars), type=3)  ## works
#                 [,1]     [,2]
# (Intercept) 37.88458 37.88458
# cyl         -2.87579 -2.87579

g(lmerTest::lmer(Reaction ~ Days + (1 | Subject), sleepstudy), type=3)  ## works
#                  [,1]      [,2]
# (Intercept) 251.40510 251.40510
# Days         10.46729  10.46729

g(lme4::lmer(Reaction ~ Days + (1 | Subject), sleepstudy), type=3)  ## fails
# Error in checkForRemoteErrors(val) :
#  2 nodes produced errors; first error: bad 'data': object 'sleepstudy' not 
#  found

还是找不到

lme4::lmer
。我玩弄了
sleepstudy
,如果我不使用它,唯一的变化是,
fenv <- new.env()
无法像其他人一样找到公式,但其中没有变化。
需要一些帮助才能让 

lme4::lmer

与所有

parSapply
lm
lme4::lmer
一起工作。我怀疑有些懒惰,所以并不是
lmerTest::lmer
对象的所有部分都导出给工作人员。也不确定他们生活在哪个环境,已经搞乱了
lmer
无济于事。

envir=parent.frame()

r linux parallel-processing lazy-evaluation lme4
1个回答
0
投票

    > sessionInfo() R version 4.3.1 (2023-06-16) Platform: x86_64-pc-linux-gnu (64-bit) Running under: Ubuntu 22.04.3 LTS Matrix products: default BLAS: /usr/lib/x86_64-linux-gnu/blas/libblas.so.3.10.0 LAPACK: /usr/lib/x86_64-linux-gnu/lapack/liblapack.so.3.10.0 locale: [1] LC_CTYPE=en_US.UTF-8 LC_NUMERIC=C LC_TIME=en_US.UTF-8 [4] LC_COLLATE=en_US.UTF-8 LC_MONETARY=en_US.UTF-8 LC_MESSAGES=en_US.UTF-8 [7] LC_PAPER=en_US.UTF-8 LC_NAME=C LC_ADDRESS=C [10] LC_TELEPHONE=C LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C time zone: Europe/Zurich tzcode source: system (glibc) attached base packages: [1] stats graphics grDevices utils datasets methods base loaded via a namespace (and not attached): [1] vctrs_0.6.3 nlme_3.1-163 cli_3.6.1 rlang_1.1.1 [5] generics_0.1.3 minqa_1.2.5 glue_1.6.2 colorspace_2.1-0 [9] lme4_1.1-34 scales_1.2.1 fansi_1.0.4 grid_4.3.1 [13] lmerTest_3.1-3 munsell_0.5.0 tibble_3.2.1 MASS_7.3-60 [17] numDeriv_2016.8-1.1 lifecycle_1.0.3 compiler_4.3.1 dplyr_1.1.2 [21] Rcpp_1.0.11 pkgconfig_2.0.3 rstudioapi_0.15.0 lattice_0.21-8 [25] nloptr_2.0.3 R6_2.5.1 tidyselect_1.2.0 utf8_1.2.3 [29] pillar_1.9.0 parallel_4.3.1 splines_4.3.1 magrittr_2.0.3 [33] Matrix_1.6-1 tools_4.3.1 gtable_0.3.4 matrixStats_1.0.0 [37] boot_1.3-28.1 ggplot2_3.4.3
  • mtcars
    之间的主要区别在于
    sleepstudy
    是基础R的一部分,因此在R的任何实例中都可用;不需要加载。
    我不确定为什么 
  • mtcars
  • 示例有效:我认为这可能是因为
    lmerTest
    depends
    (在技术意义上)lmerTest
    
    
  • 我会指出,如果我们将数据称为
lme4

而不是

lme4::sleepstudy
,一切都会正常。
lme4

如果您确保 
g(lmerTest::lmer(Reaction ~ Days + (1 | Subject), lme4::sleepstudy), type=3)

已加载到集群节点上(例如通过

lme4
),它也应该可以工作(尽管我还没有测试过)
    

© www.soinside.com 2019 - 2024. All rights reserved.