我应该选择什么作为价格预测的目标变量?

问题描述 投票:0回答:1

我有这个1990年到2017年的农业原材料的数据集,我想做一些价格预测,以便于学习。

enter image description here

这里是所有的列。

enter image description here

现在我想把数据集分成训练集和测试集,这样我就可以应用一些机器学习模型来预测,但是我脑子里不清楚什么应该是我的目标变量y,考虑到每一个列都有它们的价格,而且它们都是相互独立的。如果我想做价格预测,我应该如何对这个数据集进行拆分?

python machine-learning dataset training-data
1个回答
0
投票

从你的数据中我可以看到,有几个原材料价格可以进行预测。考虑到这些原材料价格是相互独立的,你可以创建一个只包含一个因变量(例如Copra_Price)和其余独立变量的数据集,从数据中删除其他价格相关变量。一旦你有了这个数据集,你可以很容易地用Copra_Price分成训练和测试。对于每个价格变量都可以重复这样做。

还有一个考虑因素是,如果价格变量中都没有异常,那么你可以使用其中任何一个变量来拆分数据,因为对其中一个变量进行随机选择,很有可能是跨组随机选择。

© www.soinside.com 2019 - 2024. All rights reserved.