多个KPI字段的K-均值

问题描述 投票:-1回答:1

我是机器学习的新手。我的问题可以很基本。我得到了一个k-mean训练的模型,这个模型是基于6个KPI领域。我有一个由6个KPI组成的数据集,我成功地使用了预测方法,并使用pkl文件创建了集群。看了几篇博客后,我有几个问题--。

  1. 使用6个关键绩效指标开发k-均值模型是否可取?
  2. 我正试图添加描述聚类和中心点的可视化,但无法决定我可以为所有这6个字段使用哪种图表。我可以使用哪种图表进行可视化?
python machine-learning pickle k-means
1个回答
0
投票

你在这里没有分享任何代码,这很好,至少在这种情况下。 我相信你会做这样的事情。

from scipy.cluster.vq import kmeans,vq
from sklearn.cluster import KMeans

# etc., etc.

data = np.asarray([np.asarray(df['Feature1']),np.asarray(df['Feature2'])])
# etc., etc., etc.
# run a few experiences using 2-6 KPIs. 

# computing K-Means with K = 5 (5 clusters)
centroids,_ = kmeans(data,5)
# assign each sample to a cluster
idx,_ = vq(data,centroids)

这样做有意义吗? 看看下面的链接。 我认为这个家伙很好地解释了这个概念。

https:/www.pythonforfinance.net20180208stock-clusters-using-k-means-algorithm-in-python

© www.soinside.com 2019 - 2024. All rights reserved.