K最近邻Python

问题描述投票：-2回答：1

我是数据挖掘的新手我试图在单独的培训和测试数据集上实现KNN分类器。我看到的所有教程都使用train_test_split方法来分割数据集，而我已经将数据集拆分为Train和Test。如何分配目标变量？

python data-science knn training-data test-data

1个回答

1
投票

我假设您的test数据已被标记（即在逻辑上划分为test_X和test_y，您可以使用它来测试您在train数据上训练过的模型的性能。

将列车数据加载到（train_X，train_y）并将测试数据加载到（test_X，test_y）
用火车数据训练你的模型

from sklearn.neighbors import KNeighborsClassifier
knn_clf = KNeighborsClassifier()
knn_clf.fit(train_X, train_y)

预测测试数据

y_pred = model.predict(test_X)

检查预测的准确性

import numpy as np
accuracy = np.mean(test_y == y_pred)

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.