传统聚类的入门书里,方开泰的这本真挺经典。内容是全中文,讲得比较系统,尤其适合想把多元统计搞明白的你。不光有算法,连计算思路也带着公式慢慢讲,嗯,数学基础不算太强也能跟上。

书里的层次聚类K 均值这些方法,用得还蛮多的,是在用户画像和推荐系统那类项目里。如果你之前只是会调调现成的库,看看这本你就知道背后咋回事了。

想拓展一下?我推荐两个相关文章,一个是《多元统计与聚类》,另一个是《多元统计中的聚类技术》,都是比较贴近实际用法的。

,如果你正准备做数据,或者在用scikit-learn撸聚类,还不太明白每个模型的区别,这本书看一看蛮有的。看完再写点代码,效果会更。