传统计算机的硬件组成,就像咱们写代码要懂 DOM 结构一样,搞大数据之前,先搞清楚 CPU、内存、硬盘这些基础部件挺重要的。

尤其是现在大数据满天飞,如果你连CPU是怎么和memory协作都不清楚,做分布式可就容易出坑哦。

讲信息化浪潮那一块儿挺有意思,三波浪潮像是 IT 圈的三段副本——从第一台商用机到 PC 普及,再到 Web 时代的井喷,变化太快,不看不行。

大数据的五个 V 特征也总结得蛮清楚的,VolumeVelocityVariety这些词听着玄,其实你想想微博热搜、淘宝秒杀、智能摄像头的数据流,那都是 V 的体现。

大数据可少不了HadoopSpark这些工具,说白了,它们就是能把一堆电脑攒一块来算账,配合NoSQL数据库,效率杠杠的。

云计算也是核心,IaaSPaaSSaaS这些概念不复杂,简单讲就是“买电脑资源按小时计费”,比你自己搭服务器省事多了。

如果你正准备深入了解数据、分布式架构或者云平台部署,这份资料算是打基础的好东西,适合边看边查边练。