如何使用Python将K均值中的彩色分组标签返回到数据集?

问题描述 投票:0回答:1

我对措辞非常糟糕的问题表示歉意。我正在使用k均值算法对投资组合中的各种股票进行分组,并希望采用PyPlot图表中分配给每个数据点的任何颜色,然后使用Python代码将其返回给excel电子表格。我的最终目标是查看特定组合中有多少被标记为“黑色”或“红色”。是否可以编写代码来读取PyPlot图形,采用其名称和颜色方向,然后将其导出到Excel?

很抱歉,如果这个问题太具体,并且我没有任何可使用的代码。我是新来的,所以如果这个问题不属于这里,请告诉我!

罗斯

python matplotlib machine-learning data-science k-means
1个回答
0
投票

您没有发布任何示例代码,所以我只向您展示一些通用示例代码。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
import seaborn as sns
import matplotlib.pyplot as plt


X = np.array([[5,3],
     [10,15],
     [15,12],
     [24,10],
     [30,45],
     [85,70],
     [71,80],
     [60,78],
     [55,52],
     [80,91],])

kmeans = KMeans(n_clusters=2)
kmeans.fit(X)

print(kmeans.cluster_centers_)
print(kmeans.labels_)

data = X
labels = kmeans.labels_


plt.subplots_adjust(bottom = 0.1)
plt.scatter(data[:, 0], data[:, 1], c=kmeans.labels_, cmap='rainbow') 

for label, x, y in zip(labels, data[:, 0], data[:, 1]):
    plt.annotate(
        label,
        xy=(x, y), xytext=(-20, 20),
        textcoords='offset points', ha='right', va='bottom',
        bbox=dict(boxstyle='round,pad=0.5', fc='yellow', alpha=0.5),
        arrowprops=dict(arrowstyle = '->', connectionstyle='arc3,rad=0'))

plt.show()

enter image description here

我将其留给您将结果导出到Excel。有很多方法可以做到这一点。谷歌这个话题,你应该很容易找到一些适合你的东西。

© www.soinside.com 2019 - 2024. All rights reserved.