在R中的数据框列表中添加ID列。

问题描述 投票:0回答:1

我有一个XML文件的列表,我要把它们合并在一起,但我想知道如何在其中添加一个XML文件。"id" 基于文件名的每个数据框的列。


# BUILD DATAFRAME LIST
list_filenames <- list.files(pattern = ".xml$")

df_list <- lapply(list_filenames, function(f) {

  list_ids <- as.list(list_filenames)

  doc  <- xmlParse(f, useInternalNodes = TRUE)
  doc2 <- xmlToDataFrame(doc, nodes = getNodeSet(doc, "//Event"))
  mapply(cbind, doc2, "id" = list_ids, SIMPLIFY = F)  # Code that kind of works

  })

final_df <- do.call(rbind, df_list)

我希望得到类似这样的东西。

ex_df <- cbind(x = c(3, 2, 10, 12),
               y = c("a", "b", "c", "d"),
               id = c("file_name_1", "file_name_1", "file_name_2", "file_name_2")) %>% 
  as.data.frame()

> ex_df
   x y          id
1  3 a file_name_1
2  2 b file_name_1
3 10 c file_name_2
4 12 d file_name_2
r lapply mapply
1个回答
1
投票

我们可以用 Map

nm1 <- sub("\\.xml$", "", list_filenames)
out <- do.call(rbind, Map(cbind, df_list, id = nm1))

在上位机的代码中,我们循环处理了 list_filenames 然后在第二行,使用全套的 list_filenames

as.list(list_filenames)

取而代之的是'f',也就是。

df_list <- lapply(list_filenames, function(f) {

  list_id <- sub("\\.xml$", "", f) #####

  doc  <- xmlParse(f, useInternalNodes = TRUE)
  doc2 <- xmlToDataFrame(doc, nodes = getNodeSet(doc, "//Event"))
  doc2$id = list_id
  doc2

  })

然后,我们可以 rbind 列表元素

 do.call(rbind, df_list)
© www.soinside.com 2019 - 2024. All rights reserved.