英文原版的《Mining of Massive Datasets》还挺适合前端开发者了解点大数据知识的。尤其是你做数据可视化、需要搞点数据预啥的,翻一翻还挺有启发。

讲得比较接地气,虽然是讲大数据算法,但有不少图示和例子,像 MapReduce、PageRank 这些,讲得还算清楚,不会让人看着头疼。你要是搞前后端结合的项目,懂点底层原理,交流也更顺了。

几个扩展资源也值得看看,像《大数据挖掘技术》那个 PDF,内容比较实在,另外像Overview文档也适合快速过一遍。

建议你边看边记下关键点,比如MinHashLocality Sensitive Hashing这些在推荐系统里都用得上。对了,有些公式会晦涩,跳过也没事,先理解整体流程比较重要。

如果你平时接触后端少,建议搭配个在线解释工具,像那种流程可视化的小工具,理解算法流程效果还蛮好。