我基本上是试图为测试目的而生成一个非常大的数据集,并且我有一个包含60万行的示例数据集。
我想将此df附加到自身n次,我该怎么做?
我可以手动将其绑定到自身多次,但是必须有一种自动方式来指定我希望附加到自身的次数?
您可以使用[
并重复相关的行索引。示例:
df <- data.frame(x = 1:2, y = letters[11:12])
df[rep(1:nrow(df), 10), ] # or rep(seq_len(nrow(df)), 10)
x y
1 1 k
2 2 l
1.1 1 k
2.1 2 l
1.2 1 k
2.2 2 l
1.3 1 k
2.3 2 l
1.4 1 k
2.4 2 l
1.5 1 k
2.5 2 l
1.6 1 k
2.6 2 l
1.7 1 k
2.7 2 l
1.8 1 k
2.8 2 l
1.9 1 k
2.9 2 l
考虑replicate
(包装到sapply
)以构建重复数据帧的列表,然后在末尾运行一次cbind
(或追加rbind
:]]
n <- 5
df_list <- replicate(n, mydata, simplify = FALSE)
final_df <- do.call(cbind.data.frame, df_list)
head(final_df)
这里是使用dplyr
的另一种解决方案