从列表中提取值和属性,并在R中把它们转换为数据框架。

问题描述 投票:0回答:1

我的模型得到了下面的列表,有什么方法可以选择$theta和它的所有属性,并将它们保存为数据帧?

List of 9
 $ phi           : num [1:5, 1:1500] 1.8e-04 1.8e-04 1.8e-04 1.8e-04 1.8e-04 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : chr [1:5] "t_1" "t_2" "t_3" "t_4" ...
  .. ..$ : chr [1:1500] "word1" "word2" "word3" "word4" ...
 $ theta         : num [1:500, 1:5] 0.1234 0.4567 0.01234 0.04567 0.02345 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : chr [1:500] "1" "2" "3" "4" ...
  .. ..$ : chr [1:5] "t_1" "t_2" "t_3" "t_4" ...
 $ gamma         : num [1:5, 1:1500] 0.20 0.70 0.10 0.1 0.11 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : chr [1:5] "t_1" "t_2" "t_3" "t_4" ...
  .. ..$ : chr [1:1500] "word1" "word2" "word3" "word4" ...
 $ data          :Formal class 'dgCMatrix' [package "Matrix"] with 6 slots
  .. ..@ i       : int [1:10000] 1234 6789 2233 1367 1123 1123 145 145 156 1325 ...
  .. ..@ p       : int [1:1500] 0 1 2 3 4 5 6 7 8 9 ...
  .. ..@ Dim     : int [1:2] 1234 1500
  .. ..@ Dimnames:List of 2
  .. .. ..$ : chr [1:500] "1" "2" "3" "4" ...
  .. .. ..$ : chr [1:1500] "word1" "word2" "word3" "word4" ...
  .. ..@ x       : num [1:100000] 1 1 1 1 1 1 1 1 1 1 ...
  .. ..@ factors : list()
 $ alpha         : Named num [1:5] 0.1 0.1 0.1 0.1  ...
  ..- attr(*, "names")= chr [1:5] "t_1" "t_2" "t_3" "t_4" ...
 $ beta          : Named num [1:1500] 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 ...
  ..- attr(*, "names")= chr [1:1500] "word1" "word2" "word3" "word4"

有没有办法选择$theta和它的所有属性 并将其保存为一个数据框架?换句话说,我想从列表中提取这部分。

$ theta         : num [1:500, 1:5] 0.1234 0.4567 0.01234 0.04567 0.02345 ...
  ..- attr(*, "dimnames")=List of 2
  .. ..$ : chr [1:500] "1" "2" "3" "4" ...
  .. ..$ : chr [1:5] "t_1" "t_2" "t_3" "t_4" ...

然后有一个类似于这样的数据框(列的顺序并不重要)。

Theta  | var1 | var2 |
0.1234 | 1    | t_1  |
0.4567 | 2    | t_2  |
0.01234| 3    | t_3  |

我试过 lapply 以及其他很多建议,我找到了列表提取方面的建议,但未能提取上图所示的部分。

非常感谢!

r list dataframe lapply text-mining
1个回答
3
投票

如同在评论中所提到的,你可以很容易地通过列表子集来访问$theta。model$thetamodel[['theta']].

$theta是一个500 x 5的数字矩阵,要将其转换为理想的格式,只需将其融化即可。

theta_matrix = model$theta
theta_df = reshape2::melt(theta_matrix, value.name = "Theta")

1
投票

注意: theta 是一个500×5的数字矩阵,所以数据框将有500行和5列,命名为 t_1, t_2, t_3, t_4t_5 - 它不会像你预期的输出那样是一个3行数据框。

假设你的列表被称为 my_list,这里是你如何得到 theta 作为一个数据框架。

as.data.frame(my_list$theta)

或者说

setNames(as.data.frame(my_list$theta), attr(my_list$theta, "dimnames")[[2]])
© www.soinside.com 2019 - 2024. All rights reserved.