13.3 优化目标

参考视频: 13 - 3 - Optimization Objective (7 min).mkv

K-均值最小化问题,是要最小化所有的数据点与其所关联的聚类中心点之间的距离之和, 因此 K-均值的代价函数(又称畸变函数 Distortion function)为:

其中 μc(i)代表与 x(i)最近的聚类中心点。 我们的的优化目标便是找出使得代价函数最小 的 c(1),c(2),...,c(m)和 μ1,μ2,...,μk:

回顾刚才给出的 K-均值迭代算法,我们知道,第一个循环是用于减小 c(i)引起的代价, 而第二个循环则是用于减小 μi 引起的代价。迭代的过程一定会是每一次迭代都在减小代价 函数,不然便是出现了错误。