K-means 聚类算法的例子讲得挺直观的,两个维度:XY,6 组数据,不复杂,但刚刚好能聚类的基本过程。嗯,如果你刚开始接触 数据挖掘,看完这个例子,基本就能明白 K-means 怎么一步步找中心点的。

数据列得规整,从 t1t6,每个实例都有 X 和 Y 两个属性。这种二维数据,用来练手聚类算法挺合适,画图也直观。再配合下边几个参考链接,不管你是用 PythonMatlab,还是想了解下原理,资源都安排上了。

比如用 Python 的话,可以看看这个Python 实现 K-Means 聚类算法,代码比较清晰,逻辑也不绕;喜欢用 Matlab 的话,这篇Matlab 实现 K-means 聚类算法也蛮实用,画图、聚类一把抓。

如果你更关心原理,那这篇详解 k-means 聚类算法就挺值得看,理论讲得比较细,带例子讲,读起来不枯燥。顺手推荐下这个优化文本聚类中 K-Means 算法的应用,有点进阶内容,适合想继续深入的你。

建议你边看例子边手动算下初始聚类中心,再自己写段小代码试试,比如:

import numpy as np
from sklearn.cluster import KMeans

X = np.array([[1.0, 1.5], [1.0, 4.5], [2.0, 1.5], [2.0, 3.5], [3.0, 2.5], [5.0, 6.0]])

kmeans = KMeans(n_clusters=2).fit(X) print(kmeans.labels_)

,这套例子配合链接资源,蛮适合新手练习的。如果你刚学完聚类相关的章节,可以拿来复习下、写点小实验啥的。