入门级的 Mahout 学习资料,内容挺全,讲得也不绕,适合刚接触机器学习的人。尤其是用 Java 的朋友,看着会比较亲切,毕竟 Mahout 就是 Apache 家出的,和 Hadoop、Spark 啥的关系还挺近。资源里有不少配套案例,像协同过滤
、推荐系统
之类的,讲得算清楚,代码也比较容易上手。
Mahout 的算法实现方式偏矩阵计算,所以如果你对线性代数不太熟,建议先看看矩阵学习与机器学习衔接,蛮适合打基础的。搞明白稀疏矩阵、特征向量这些东西之后,再去看 Mahout 的源码也不至于太吃力。
另外像机器学习算法实战和系统设计案例这些,配着 Mahout 来读也挺有的。是做推荐系统或者分类模型的场景,能学到不少实用的思路。
要是你本身就在玩 Spark 或者 PySpark,也可以顺带看下机器学习与 Spark 指南和PySpark 实战,两边对照着学,理解会更透一些。
,如果你是想从Java 生态
的角度切入机器学习,那 Mahout 算是个还不错的起点。环境搭建也不复杂,适合边看边练。嗯,建议多试试例子,哪怕改改参数也行,动手之后理解会快多。