tidyverse中带index参数的by()等价于什么?

问题描述 投票:0回答:1

我有一个带有名称列和股票行的数据框,股票行的行用“;”修饰。名称超过1个的代码。可以从下面的data.frame中窥见:

df.info是数据框的名称

Rows: 525
Columns: 2
$ name.company <chr> "521 PARTICIPAÇOES S.A. - EM LIQUIDAÇÃO EXTRAJUDICIAL", "524 PARTICIPAÇOES SA", "AAJR SECURITIZADORA DE CRÉDITO...
$ tickers      <chr> NA, "QVQP3B", NA, "ADHM3", "TIET11;TIET3;TIET4", "AFLT3", NA, "ALEF3B", "RPAD3;RPAD5;RPAD6", NA, "ALSO3", "ALPA...

而且我想要一个具有两列的数据框,代码和名称.company,但不包含修剪模式“;”。

e.g.: 
name   ticker
tiete  tiet11
tiete  tiet3
tiete  tiet4 

就这样了。我使用by()函数解决了它,但是我不知道如何使用tidyverse / purrr包来解决它。

不带打折的解决方案

get.ticker.df <- function(df.in)
{
   # Gets ticker string and organizes it in another data_frame
   temp.split <- str_split(df.in$tickers, ';')[[1]]
   temp.df <- tibble(name.company = df.in$name.company,
                         ticker = temp.split)
}

 my.l <- by(data = df.info,
               INDICES = df.info$name.company,
               FUN = get.ticker.df)

    df.tickers <- bind_rows(my.l)

我不知道tidyverse中此by()函数的等效项。

编辑-添加了初始帧和理想结果数据帧,以使其清晰。

tibble_start <- tibble( name.company = c("AES TIETE", "AMBEV"),
                        ticker = c("TIET11;TIET3;TIET4", "ABEV3;ABEV4"))

tibble_ideal <- tibble( name.company = c( rep("AES TIETE", 3), rep("AMBEV",2)),
                        ticker = c("TIET11","TIET3","TIET4","ABEV3","ABEV4"))

提前感谢!

r functional-programming tidyverse data-modeling
1个回答
0
投票

我们可以使用separate_rows

library(dplyr)
library(tidyr)
df1 %>%
  separate_rows(tickers)
© www.soinside.com 2019 - 2024. All rights reserved.