难道名称和功能的顺序关系的预测算法

问题描述 投票:0回答:1

难道我X_test数据框的列的名称/顺序必须是相同X_train我使用的配件?

下面是一个例子:

我训练我的模型:

model.fit(X_train,y)

其中X_train=data['var1','var2']

但随后预测期间,当我使用:

model.predict(X_test)

X_test定义为:

`X_test =数据[ 'VAR1', 'VAR3']

其中var3可以比var2一个完全不同的变量。是否predict假设var3相同var2,因为它是在X_test第二列?

如果:

X_live被定义为:`X_live =数据[ 'VAR2', 'VAR1']

可以预测知道重新排序X正确地排列起来?

python predict data-fitting
1个回答
1
投票

你列的名称并不重要,但顺序一样。你需要确保的顺序是从你的训练和测试数据是一致的。如果你在两列传递到自己的训练数据,模型假定未来的投入是按照这个顺序这些功能。

只是一个非常简单的思想实验。想象一下,你训练减去两个数字的模型。其特点是(N_1,N_2),并且您的输出将是N_1 - N_2。

您的模型不处理你列的名字(因为只有编号传入),所以它学习第一栏,第二栏和输出之间的关系 - 即output = col_1 - col_2

无论你通过什么,你会得到你减去你在通过第二件事传递的第一件事情的结果。你可以说出你传递第二件事你传递给任何你想的第一件事,但在一天结束时,你仍然会得到减法的结果。

为了争取多一点的技术,这是怎么回事你的模型里面主要是一个系列矩阵乘法。您传递的输入矩阵,乘法发生,你会得到什么出来。模型训练只是“曲调”的值,你的投入得到最大化这些乘法的输出如何接近你的标签的意图乘以矩阵。如果您在不喜欢被训练的那些输入矩阵传球,乘法还是发生了,但你几乎肯定会得到一个可怕的错误输出。有没有智能功能重新安排下回事。

© www.soinside.com 2019 - 2024. All rights reserved.