kNN似乎相对容易理解:您拥有数据点,并在特征空间中绘制它们(在2维特征空间中,与在xy平面图上绘制点相同)。当您想对新数据进行分类时,可以将新数据放到相同的特征空间中,找到最近的k个邻居,并查看它们的标签,最终选出票数最高的标签。
那么在这里玩的可能性在哪里?我要做的是计算两点之间的距离并获取最近邻居的标签。
对于新的测试样品,您查看最近的K个邻居,并查看其标签。您可以对每个类别中的K个样本进行计数,然后将计数除以类别数。
例如,假设您的分类器中有2个类别,并且您使用K = 3个最近的邻居,而这3个最近的样本的标签为(0,1,1)-类别0的概率为1/3并且类别1的概率为2/3。