K-均值聚类和矢量量化有什么区别?
它们看起来很相似。
我正在处理隐马尔可夫模型,我需要从特征向量中提取符号。
为了提取符号,我要进行矢量量化还是k均值聚类?
根据我的理解,K均值是矢量量化的一种类型。
K-means算法是著名的“ Lloyd I”量化算法针对经验分布情况的特化。 (比照劳埃德)
Lloyd I算法被证明可以产生具有减少的二次失真的量化器序列。但是,除了在一维对数凹面分布的特殊情况下,它并不总是收敛于二次最优量化器。 (对于量化误差,存在局部最小值,尤其是在处理经验分布即聚类问题时。)
一种趋向(总是)朝着最佳量化器收敛的方法是所谓的CLVQ算法,它也推广到更通用的Lp量化问题。这是一种随机梯度法。 (比照Pagès)
也有一些基于遗传算法的方法。 (参见Hamida等人),和/或收敛速度更快的一维案例的经典优化程序(Pagès,Printems)。