我有一个具有10333条记录的数据框df
df.shape[0]
10333
我想平均分割记录,然后平均写入其他四个数据帧。这怎么办。
df1.shape[0] =2853
df2.shape[0] =2853
df3.shape[0] =2853
df4.shape[0] =2854
如何完成。我正在寻找解决方案,根据记录中提到的存储桶数平均分配记录。
这是tile
的解决方案:
ll = len(df)
groups = np.tile(np.arange(4), ll)[:ll]
dfs = {k:v for k,v in df.groupby(groups)}
len(dfs), len(dfs[0])
# (4, 2584)
# so the lengths of dataframes are 2854, 2853, 2853, 2853