基于 Hadoop 的数据挖掘算法实现,蛮适合想搞大数据方向的你。Hadoop 的 HDFS、MapReduce 这些都不陌生吧?嗯,文里讲得还挺细,尤其是跟 HBase 搭配做聚类那块,K-Means 和 PAM 都上手实战了。整个系统从用户层到底层驱动都搭好了,挺有借鉴意义的。尤其你要做个推荐系统或者用户画像那类的项目,这内容就对路子了。顺便说一句,代码不是复杂,逻辑也清晰,新手也能跟上节奏。