未知标签类型:用于股价预测的SVM模型中的 "连续"。

问题描述 投票:0回答:1

我想写一个SVM的代码。我的目的是预测每周S&P股票的股价。我使用苹果每周的股票价格为 y_train还有我的 x_train 是市场价格和两个Fama-french因素。

在代码的最后,我遇到了。

未知标签类型:"连续"。

我不知道是什么问题。你能帮助我吗?这是我的代码。

import pandas as pd
import numpy as np
import sklearn
from sklearn import svm
from sklearn import metrics

data = pd.read_csv('combine_weekly.csv',sep=',')

data= data[['return_app','return_sp','SMB','HML']]

predict='return_app'

x= np.array(data.drop([predict],1))
y= np.array(data[predict])

x_train, x_test, y_train, y_test = 
sklearn.model_selection.train_test_split(x,y,test_size=0.2)

clf = svm.SVC(kernel= 'linear', C= 4)
clf.fit(x_train, y_train).     <<<<< >>>*** here I get the error ***


y_pred = clf.predict(x_test )
acc= metrics.accuracy_score(y_test, y_pred)
print(acc)
python svm svc
1个回答
0
投票

你的标签是连续的数字(如1,2,3.5,4.2,5.6等),可以作为回归问题处理。虽然你使用的是svm.SVC,它是一个分类器(在这里我们得到的类是标签,如'水果','蔬菜'等&在你的情况下没有实数)&不是回归器。你可以选择LinearRegression,XGBRegressor等来解决这个问题

© www.soinside.com 2019 - 2024. All rights reserved.