sklearn火车测试按年份划分

问题描述 投票:0回答:1

我有一个数据集,从2016年到2020年,有一个 "年份 "列。我想用2016-2017年作为训练数据,2018-2020年作为测试数据。有没有什么简单的方法来执行这个数据拆分?

python scikit-learn split
1个回答
0
投票

你可以使用groupby函数将2016年到2017年的所有数据分组作为训练数据,并将2018-2020年的数据分组作为测试数据.或者你也可以使用以下代码。

df_train = df[df['year'].isin(2016,2017)] and df_test = df[df['year'].isin(2018,2019,2020)]
© www.soinside.com 2019 - 2024. All rights reserved.