概率如何在kNN算法中发挥作用？

kNN似乎相对容易理解：您拥有数据点，并在特征空间中绘制它们（在2维特征空间中，与在xy平面图上绘制点相同）。当您想对新数据进行分类时，可以将新数据放到相同的特征空间中，找到最近的k个邻居，并查看它们的标签，最终选出票数最高的标签。

那么在这里玩的可能性在哪里？我要做的是计算两点之间的距离并获取最近邻居的标签。

scikit-learn probability knn nearest-neighbor ml

0
投票

对于新的测试样品，您查看最近的K个邻居，并查看其标签。您可以对每个类别中的K个样本进行计数，然后将计数除以类别数。

例如，假设您的分类器中有2个类别，并且您使用K = 3个最近的邻居，而这3个最近的样本的标签为（0,1,1）-类别0的概率为1/3并且类别1的概率为2/3。