将ggplot对象存储在R中的循环内的列表中

问题描述 投票:17回答:2

我的问题类似于this one;当我在循环中生成绘图对象(在这种情况下是直方图)时,似乎所有这些都被最近的绘图覆盖。

要在循环中进行调试,我将打印索引和生成的绘图,两者都正确显示。但是,当我查看列表中存储的图表时,除标签外,它们都是相同的。

(我正在使用多重图来制作合成图像,但如果你一次通过print (myplots[[1]]) print(myplots[[4]]),你会获得相同的结果。)

因为我已经有一个附加的数据帧(不像类似问题的海报),我不知道如何解决这个问题。

(顺便说一句,列类是我在这里逼近的原始数据集中的因子,但如果它们是整数则会出现同样的问题)

这是一个可重复的例子:

library(ggplot2)
source("http://peterhaschke.com/Code/multiplot.R") #load multiplot function

#make sample data
col1 <- c(2, 4, 1, 2, 5, 1, 2, 0, 1, 4, 4, 3, 5, 2, 4, 3, 3, 6, 5, 3, 6, 4, 3, 4, 4, 3, 4, 
          2, 4, 3, 3, 5, 3, 5, 5, 0, 0, 3, 3, 6, 5, 4, 4, 1, 3, 3, 2, 0, 5, 3, 6, 6, 2, 3, 
          3, 1, 5, 3, 4, 6)
col2 <- c(2, 4, 4, 0, 4, 4, 4, 4, 1, 4, 4, 3, 5, 0, 4, 5, 3, 6, 5, 3, 6, 4, 4, 2, 4, 4, 4, 
          1, 1, 2, 2, 3, 3, 5, 0, 3, 4, 2, 4, 5, 5, 4, 4, 2, 3, 5, 2, 6, 5, 2, 4, 6, 3, 3, 
          3, 1, 4, 3, 5, 4)
col3 <- c(2, 5, 4, 1, 4, 2, 3, 0, 1, 3, 4, 2, 5, 1, 4, 3, 4, 6, 3, 4, 6, 4, 1, 3, 5, 4, 3, 
          2, 1, 3, 2, 2, 2, 4, 0, 1, 4, 4, 3, 5, 3, 2, 5, 2, 3, 3, 4, 2, 4, 2, 4, 5, 1, 3, 
          3, 3, 4, 3, 5, 4)
col4 <- c(2, 5, 2, 1, 4, 1, 3, 4, 1, 3, 5, 2, 4, 3, 5, 3, 4, 6, 3, 4, 6, 4, 3, 2, 5, 5, 4,
          2, 3, 2, 2, 3, 3, 4, 0, 1, 4, 3, 3, 5, 4, 4, 4, 3, 3, 5, 4, 3, 5, 3, 6, 6, 4, 2, 
          3, 3, 4, 4, 4, 6)
data2 <- data.frame(col1,col2,col3,col4)
data2[,1:4] <- lapply(data2[,1:4], as.factor)
colnames(data2)<- c("A","B","C", "D")

#generate plots
myplots <- list()  # new empty list
for (i in 1:4) {
  p1 <- ggplot(data=data.frame(data2),aes(x=data2[ ,i]))+ 
    geom_histogram(fill="lightgreen") +
    xlab(colnames(data2)[ i])
  print(i)
  print(p1)
  myplots[[i]] <- p1  # add each plot into plot list
}
multiplot(plotlist = myplots, cols = 4)

当我在情节列表中查看绘图对象的摘要时,这就是我所看到的

> summary(myplots[[1]])
data: A, B, C, D [60x4]
mapping:  x = data2[, i]
faceting: facet_null() 
-----------------------------------
geom_histogram: fill = lightgreen 
stat_bin:  
position_stack: (width = NULL, height = NULL)

我认为mapping: x = data2[, i]是问题,但我很难过!我无法发布图片,因此如果我对问题的解释令人困惑,您需要运行我的示例并查看图表。

谢谢!

r plot ggplot2
2个回答
39
投票

除了其他优秀的答案,这里的解决方案使用“正常”的评价而不是eval。由于for循环没有单独的变量范围(即它们在当前环境中执行),我们需要使用local来包装for块;另外,我们需要使i成为局部变量 - 我们可以通过将其重新分配给自己的name1来实现:

myplots <- vector('list', ncol(data2))

for (i in seq_along(data2)) {
    message(i)
    myplots[[i]] <- local({
        i <- i
        p1 <- ggplot(data2, aes(x = data2[[i]])) +
            geom_histogram(fill = "lightgreen") +
            xlab(colnames(data2)[i])
        print(p1)
    })
}

然而,一种更简洁的方法是完全放弃for循环并使用list函数来构建结果。这有几种可能的方式。以下是我认为最简单的方法:

plot_data_column = function (data, column) {
    ggplot(data2, aes_string(x = column)) +
        geom_histogram(fill = "lightgreen") +
        xlab(column)
}

myplots <- lapply(colnames(data2), plot_data_column, data = data2)

这有很多优点:大多数情况下它更简单,它不会使环境混乱(使用循环变量i)。


1这可能看起来令人困惑:为什么i <- i会有任何影响? - 因为通过执行赋值,我们创建了一个新的局部变量,其名称与外部作用域中的变量相同。我们同样可以使用不同的名称,例如local_i <- i


7
投票

由于所有传递的表达式的引用,在循环结束时计算的i是当时恰好是i,这是它的最终值。您可以在每次迭代期间通过eval(substitute(ing以正确的值来解决这个问题。

myplots <- list()  # new empty list
for (i in 1:4) {
    p1 <- eval(substitute(
        ggplot(data=data.frame(data2),aes(x=data2[ ,i]))+ 
          geom_histogram(fill="lightgreen") +
          xlab(colnames(data2)[ i])
    ,list(i = i)))
    print(i)
    print(p1)
    myplots[[i]] <- p1  # add each plot into plot list
}
multiplot(plotlist = myplots, cols = 4)
© www.soinside.com 2019 - 2024. All rights reserved.