常用数据挖掘算法的实用总结,讲得挺接地气的,尤其是几个聚类方法,像是分层聚类、K 均值这些都拆解得清楚。每种算法后面都给了使用建议,配合实际场景说得还挺细,像最大距离法就适合需要类间差异大的时候用。向量空间模型的部分也不错,讲了怎么结合聚类提升检索效率,蛮有参考价值。如果你平时会用到文本、数据聚类,那这份资料还蛮值得一看。