k-means 相关问题

在统计和数据挖掘中,k均值聚类是一种聚类分析方法,其目的是将n个观测值划分为k个聚类,其中每个观测值属于具有最近平均值(最小二乘法)的聚类。

如何连接列表数据类型和int32数据类型?

我在网上找到了一些看起来非常非常有趣的代码。我正在尝试使其运行;在此行出现错误。 #创建一个对齐标签的DataFrame&公司df = pd.DataFrame({'...

回答 1 投票 0

python kmedoids-更有效地计算新的medoid中心

[我正在关注一篇出色的中篇文章:https://towardsdatascience.com/k-medoids-clustering-on-iris-data-set-1931bf781e05,从头开始实现kmedoids。代码中有一个位置,其中...

回答 1 投票 1

Python质心中的KMeans位置不正确,如何对其进行“缩放”?

我有一个小的脚本可以在jupyter笔记本中运行。 Kmeans似乎工作正常,但我的质心已按比例缩小。如何使它们正确显示在我的绘图上?我的x和y的范围是...

回答 1 投票 0

sklearn簇标签的格式是什么?

我正在使用sklearn将一些文本行聚类,但是试图了解返回的聚类标签的格式。看起来像这样:km_model.labels_ array([5,35,1,29,49,2,6,28,5,4,...

回答 1 投票 0

如何选择以k均值表示最大频率的聚类

我从Gensim word2vec创建了一个k均值聚类,其中k的值为3。现在我想检索该聚类以及频率最高的值。从gensim.models导入gensim ...

回答 1 投票 0

如何在特定列上显示kmeans?

我想对我的数据集的特定列进行K均值。由于这些是分类数据,因此我打算对其进行onehot_encoding。现在我想知道是否有可能在...

回答 1 投票 -1

是否有比K更快的聚类方法?

我在一个盒子里有手写数字,我正试图将手写数字拉出来。尺寸为208 x 117,因此约为24k像素。我想利用我有颜色的事实,所以...

回答 1 投票 0

可以帮助将数组适合kmeans聚类

当我尝试使其适合kmeans集群时,会引发错误“ ValueError:设置具有序列的数组元素。”从sklearn.cluster导入KMeans kmeans = KMeans(n_clusters = 5)kmeans.fit(df)...

回答 1 投票 0

DataFrame没有给我我需要的情节

我使用k-means到Mergory数据集,然后我想要绘制两列的图表,即住院列与油炸列,因此我在下面编写代码:fig = plt.figure(figsize =(5,5))colors = map (lambda x:...

回答 1 投票 0

使用k均值进行背景减法的图像分割

有人可以为此提供更好的解决方案吗?使用k均值从背景对前景图像进行聚类时出现问题,当背景具有...

回答 1 投票 0

出现一个奇怪的错误,提示'使用array.reshape(-1,1)重塑数据”

我正在测试此代码。 #从sklearn.pipeline导入必要的包从sklearn.preprocessing导入make_pipeline从sklearn.cluster import KMeans导入Normalizer#定义一个...

回答 1 投票 0

将K均值聚类距离度量更改为堪培拉距离或python上的任何其他距离度量

如何将k均值聚类的距离度量更改为堪培拉距离或任何其他距离度量?根据我的理解,sklearn仅支持欧氏距离,而nltk似乎不支持...

回答 1 投票 0

获得nltk k的惯性意味着使用余弦相似度进行聚类

我已经使用nltk进行k个均值聚类,因为我想更改距离度量。 nltk k表示的惯性是否类似于sklearn?似乎无法在他们的文档中或在线上找到。....

回答 1 投票 0

使用R自动将插入到大SpatialPolygon中的小SpatialPolygons重新分类

我想为嵌套在较大多边形中的小多边形分配与较大多边形相同的值。在图1中,您可以看到栅格格式的小多边形:在图2中,...

回答 1 投票 0

如何使用nltk(python)获得K均值簇的各个质心

我已经使用nltk执行k个均值聚类,因为我想将距离度量更改为余弦距离。但是,如何获得所有群集的质心? kclusterer = ...

回答 1 投票 0

如何使用Python中的K-Means聚类划分数据

i使用K-Means聚类算法将我的数据分为4部分。我将其可视化,但现在我需要将每个群集作为数据框。有什么办法吗?

回答 1 投票 -1

聚类之前的归一化

如果我们有使用假人和标签编码将分类数据转换为数值的分类数据,是否必须在聚类之前对数据进行归一化?如果是,那么哪个是最多的...

回答 1 投票 0

多维K均值的绘图结果

我有一个关于R中的Kmeans的问题。我有一个数据框,例如R中可用的IRIS数据。我找到了一个网站,他们在其中创建了kmeans结果,我喜欢:我的问题是,我想...] >

回答 1 投票 1

Kmeans:簇的大小错误

我正在心脏病UCI数据集上的R中运行Kmeans算法。我应该得到2个具有138 165大小的集群,就像数据集中的集群一样。步骤:将数据集存储在数据框中:df

回答 2 投票 0

TESPAR编码方法-如何生成字母?

我利用TESPAR(时间编码信号处理和识别)方法对输入信号进行编码。在将数据划分为多个时期之后,我想为每个时期分配一个符号,但是我有一些...

回答 1 投票 1

© www.soinside.com 2019 - 2024. All rights reserved.