万物互联时代的大数据架构讲得挺到位的,《漫谈大数据和数据挖掘》就是那种你读完会点头的 PDF。前面讲了从 IT 到 DT 的演进,后面聊大数定律、Lambda/Kappa 架构,还有不少实用的例子,比如女童爱穿旅游鞋这个,蛮有意思。

数据仓库部分也讲得比较细,ER 模型维度模型各自的适用场景得清楚。还有那四个 V:volume、variety、value、velocity,基本算是大数据入门的金句了。读完后对怎么搭架构、怎么做心里就有数了。

如果你是做前端的,虽然不直接写大数据代码,但了解这些技术背后的逻辑,和后端联调时就更顺畅了。比如你在可视化一个数据报表时,知道数据是从哪儿来的,怎么加工的,对前端结构设计也有。

顺便推荐几个相关资源,像大数据挖掘教程大数据学习笔记,内容都还蛮实在,能你把理论和项目结合起来。

如果你刚开始接触数据架构或者打算做数据可视化,那这份 PDF 可以看看,不复杂,读起来还挺有收获的。