我正在尝试向数据集添加索引,该数据集太大而无法容纳在 RAM 中。添加索引的 tidyverse 方法是:
library(tidyverse) df = mtcars df |> mutate(row_id = 1:nrow(cyl)) # any column name in the df
Arrow 的 Dplyr 后端不允许执行此操作。我还能怎样做?