传统计算机的硬件组成,就像咱们写代码要懂 DOM 结构一样,搞大数据之前,先搞清楚 CPU、内存、硬盘这些基础部件挺重要的。
尤其是现在大数据满天飞,如果你连CPU
是怎么和memory
协作都不清楚,做分布式可就容易出坑哦。
讲信息化浪潮那一块儿挺有意思,三波浪潮像是 IT 圈的三段副本——从第一台商用机到 PC 普及,再到 Web 时代的井喷,变化太快,不看不行。
大数据的五个 V 特征也总结得蛮清楚的,Volume
、Velocity
、Variety
这些词听着玄,其实你想想微博热搜、淘宝秒杀、智能摄像头的数据流,那都是 V 的体现。
大数据可少不了Hadoop、Spark这些工具,说白了,它们就是能把一堆电脑攒一块来算账,配合NoSQL
数据库,效率杠杠的。
云计算也是核心,IaaS、PaaS、SaaS这些概念不复杂,简单讲就是“买电脑资源按小时计费”,比你自己搭服务器省事多了。
如果你正准备深入了解数据、分布式架构或者云平台部署,这份资料算是打基础的好东西,适合边看边查边练。