如何在python中执行elbow方法？

Question

我想用弯头方法检查k的最佳数量。我没有使用scikit-learn库。我的k-means从头开始编码，现在我很难搞清楚如何在python中编写elbow方法。我是初学者。

这是我的k-means代码：


def cluster_init(array, k):

    initial_assgnm = np.append(np.arange(k), np.random.randint(0, k, size=(len(array))))[:len(array)]
    np.random.shuffle(initial_assgnm)
    zero_arr = np.zeros((len(initial_assgnm), 1))

    for indx, cluster_assgnm in enumerate(initial_assgnm):
        zero_arr[indx] = cluster_assgnm
    upd_array = np.append(array, zero_arr, axis=1)

    return upd_array


def kmeans(array, k):

    cluster_array = cluster_init(array, k)


    while True:
        unique_clusters = np.unique(cluster_array[:, -1])

        centroid_dictonary = {}
        for cluster in unique_clusters:
            centroid_dictonary[cluster] = np.mean(cluster_array[np.where(cluster_array[:, -1] == cluster)][:, :-1], axis=0)


        start_array = np.copy(cluster_array)


        for row in range(len(cluster_array)):
            cluster_array[row, -1] = unique_clusters[np.argmin(
                [np.linalg.norm(cluster_array[row, :-1] - centroid_dictonary.get(cluster)) for cluster in unique_clusters])]

        if np.array_equal(cluster_array, start_array):
            break

    return centroid_dictonary

这是我为肘法所尝试的：

cost = []
K= range(1,239)
for k in K :
    KM = kmeans(x,k)
    print(k)
    KM.fit(x)
    cost.append(KM.inertia_)

但是我收到以下错误

KM.fit（X）

AttributeError：'dict'对象没有属性'fit'

Answer 1

如果要从头开始计算弯头值，则需要计算当前聚类分配的惯量。为此，您可以计算粒子惯量的总和。来自数据点的粒子惯性是从其当前位置到最近中心的距离。如果你有一个为你计算的函数（在scikit中学习这个函数对应于pairwise_distances_argmin_min）你可以做

labels, mindist = pairwise_distances_argmin_min(
    X=X, Y=centers, metric='euclidean', metric_kwargs={'squared': True})
inertia = mindist.sum()

如果你真的想要编写这个函数，你会做的是在X中的每一行x上循环，找到dist（x，y）的Y中所有y的最小值，这将是你对x的惯性。这种计算粒子惯性的天真方法是O（nk），因此您可以考虑使用库函数。

如何在python中执行elbow方法？

问题描述投票：1回答：1

1个回答

最新问题

如何在python中执行elbow方法？

问题描述 投票：1回答：1

1个回答

最新问题

问题描述投票：1回答：1