在模式识别中,k近邻(k-NN)是用于基于一组已经分类的示例对示例进行分类的分类算法。算法:通过其邻居的多数投票对案例进行分类,案例被分配给由距离函数测量的其K个最近邻居中最常见的类。如果K = 1,则将该情况简单地分配给其最近邻居的类。
如何在cross_validate()python sklearn中使用马哈拉诺比斯距离?错误-V的大小不匹配
如何在cross_validate()python sklearn中使用马哈拉诺比斯距离?我收到错误消息是因为错误-V的大小不匹配。这是我的代码模型= neighbors.KNeighborsClassifier(n_neighbors = 5,metric =“ ...
我有一个带有2个变量的csv数据框(一个输入数据框,用X表示)和另一个由我的目标变量组成的numpy数组。看起来像这样:> X Duration Grand Mean ...
图k-NN错误:IndexError:索引1超出尺寸1的轴1的范围
我是机器学习的新手,并希望绘制一个k-NN分类器图。我收到此错误“ indexError:索引1超出了尺寸1的轴1的范围”,我不明白... ...>
我有一个数据库,我们经常需要对字符串进行模糊/距离匹配。在此示例中,目标citext字段名为analytic_scan.inv_name。但是相同类型的代码可能是...
我有一个只有20个数据点的csv文件,我想知道一个新数据点的最近邻居。我的csv文件看起来像这样的临时雨79 12 81 13 79 4 61 ...
我对编程还很陌生,我创建了一个函数来计算1 K最近邻居(KNN1)来进行预测。问题是,代码太慢了,我无法在训练集上测试它... ... >>
如何在BaggingClassifier中使用KNeighborsClassifier以及如何解决“ KNN不支持样本权重问题”
我是Sklearn的新手,我正在尝试将KNN,决策树,SVM和高斯NB结合用于BaggingClassifier。我的部分代码如下所示:best_KNN = KNeighborsClassifier(n_neighbors = 5,p = 1)...
我正在编写一个程序来为我的数据集中的每个数据点获取3个最近的邻居。我的数据集具有47个要素,其中包含5000行条目,并且没有目标变量。我在这里用它来适应我的整个...
我正在研究螃蟹物种数据集。我有7个因素,并且正在努力将物种预测为1或0。我的目标是使准确度达到100%。我已经尝试过从1到60的多个k,但无法获得它...
[我试图使自己的方法比基于虹膜数据集的教程更灵活地输入knn输入脚本,但是我在将匹配的第二维添加到numpy时遇到了麻烦(我认为)...
我正在尝试从我的数据框中的一列中删除所有不相关的信息,但不知道如何执行。我将数据从CSV文件直接导入到数据框。 0 [{“ id”:...
Tidymodels带有调整的错误:错误:没有注册tidyselect变量
我正在从此处运行以下代码我的代码库(调优)库(AmesHousing)库(工作流程)#------------------------- -------------------------------------------------- --- ames
NN和贪婪搜索算法都具有贪婪性,并且都具有成本/距离最低的趋势(尽管我的理解可能不正确)。但是是什么使它们在某种程度上有所不同...
[尝试使我的分类接受文本(字符串),而不仅仅是数字(数字)。处理数据,承载大量拉出的文章,我希望分类算法显示要... ...>
如何找到两个向量之间的距离,其中某些字段是字符串(名称,地址等)而其他字段是数字
我必须找到2条记录之间的距离。每个记录都是多个字段的向量。其中一些字段是数字。其他是字符串。如何得出距离的单个值。我可以...
我有一个CSV文件(corpus.csv),其中带有以下格式的语料库分级摘要(文本):Institute,Score,Abstract -------------------- -------------------------------------------------- ...
需要一个函数,该函数返回的估计值等于最接近k个指向p的点的均值?
定义一个函数,该函数采用一维NumPy数组,一个参数k和一个数字p。该函数返回一个估计值,该估计值等于最接近k个点p的平均值。 def k_neighbor(input_data,k,...
sklearn-KN eighborsClassifier-ValueError:未知标签类型:'continuous'
我不知道为什么这段代码不起作用? training_data_X = np.array([[1.2,6.7,2.7],[2.3,4.6,2.2],[0.3,3.9,0.8],[2.1,1.3,4.3]])training_scores_Y = np.array([1.4,9.2 ,2 ....