我在R工作,试图从列表数据结构中提取数字向量。这是一个可重复的小例子,它反映了更大的数据集的结构。
# Create a reproducible example multi-level list structure
mylist <- list()
mylist$`1` <- c("barcodes","data")
mylist$`2` <- c("barcodes","data")
mylist$`3` <- c("barcodes","data")
mylist$`1`$barcodes <- c(1:50)
mylist$`2`$barcodes <- c(50:200)
mylist$`3`$barcodes <- c(1:200)
我能够使用以下命令成功生成我需要的数据,称为numbers
。然而,这要求我对每个感兴趣的数据集进行硬编码,这是不理想的。
numbers <- c(mylist$`1`$barcodes[1:5],
mylist$`3`$barcodes[1:5])
#This does achieve the desired result
#> numbers
#[1] 1 2 3 4 5 1 2 3 4 5
我试图在没有硬编码的情况下以高吞吐量方式执行此操作。以下是我的尝试。
nums_of_interest <- c(1,3)
numbers <- c(gsub(" ", "", paste("mylist$'",nums_of_interest,"'$barcodes[1:5]")))
# This does not achieve the desired result
#> numbers
#[1] "mylist$'1'$barcodes[1:5]" "mylist$'3'$barcodes[1:5]"
我正在努力找出一种以高吞吐量方式提取感兴趣的1 2 3 4 5 1 2 3 4 5
数量的方法。
这是lapply
的一个选项。第一行从列表中提取"barcodes"
,它返回一个列表。
lst <- lapply(mylist, `[[`, "barcodes")
现在,当我们从lst
的一个子集中提取前5个条目时,我们几乎再次这样做,即从lst[nums_of_interest]
中提取。
nums_of_interest <- c(1, 3)
(numbers <- lapply(lst[nums_of_interest], `[`, 1:5))
#$`1`
#[1] 1 2 3 4 5
#
#$`3`
#[1] 1 2 3 4 5
由于numbers
是一个列表,但你想要一个向量作为回报,使用unlist
(和unname
)来获得所需的输出。
unname(unlist(numbers))
# [1] 1 2 3 4 5 1 2 3 4 5
或者在一行中获得@avid_useR的学分
unname(unlist(lapply(mylist[nums_of_interest], function(x) x[['barcodes']][1:5])))
使用map
:
library(purrr)
num_of_interst <- c(1,3)
numbers <- unlist(map(mylist[num_of_interst], ~.[["barcodes"]][1:5]))