如何解释$k-NN$分类器中$k$的值

Question

我们应该如何解释$k-NN$分类器中$k$的值，特别是$k=1$是什么意思？对 ML 新手或参考的任何解释将不胜感激！

Answer 1

在 Knn 或 K 最近邻（用于分类）中，我们的想法是我们使用

“最近”点通过查看训练数据中的哪些点最接近我们的样本来对样本进行分类。

引用

scikit-learn

的简短描述：

最近邻方法背后的原理是找到一个预定义的距离新点最近的训练样本数，以及从这些预测标签。样本数量可以是用户定义的常量（k-最近邻学习），或基于点的局部密度（基于半径的邻居学习）。这一般来说，距离可以是任何度量标准：标准欧几里德距离是最常见的选择。基于邻居的方法是已知的作为非泛化机器学习方法，因为它们只是 “记住”它所有的训练数据。

Answer 2

在k-NN分类中，

表示问题的类数。

您不要将它解释为算法的参数，您需要清楚地知道您想要什么

或猜测它。一种常见的技术是使用

k=sqrt(n)

其中 n 是样本数。

使用

k=1

没有分类，因为所有值都属于同一类，算法变得微不足道。

关于

的值的讨论见这个问题k最近邻算法中k的值

如何解释$k-NN$分类器中$k$的值

问题描述投票：0回答：2

2个回答

最新问题

如何解释$k-NN$分类器中$k$的值

问题描述 投票：0回答：2

2个回答

最新问题

问题描述投票：0回答：2