我有一个分类问题,我想对 A、B 和 C 类进行分类。我尝试使用朴素贝叶斯分类器,准确率是 100%,我真的怀疑这不是真的。我有大约350个的小数据集,其中A类是140个,B类是140个,其余的是C类。这是我使用的代码。有人可以给我一些建议吗?
import sklearn
from sklearn.metrics import accuracy_score
X = feature_data_frame.values
y = label_data
import sklearn.preprocessing as preprocessing
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import GaussianNB, MultinomialNB
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=.10)
gnb = GaussianNB()
y_pred = gnb.fit(x_train, y_train).predict(x_test)
accuracy = accuracy_score(y_test, y_pred)
提前致谢。
几天前,我在使用高斯朴素贝叶斯分类器将股票数据分类为风险类和非风险类时也遇到了同样的问题。
您的代码中可能存在两个问题:
让我们知道进展如何!