华为的大数据教材,内容挺全的,涵盖了从入门到进阶的整个路线,适合想系统学大数据的前端、后端或者数据工程师。
HCIA-BigData_V2.0的教材,主要讲基础概念,比如怎么存数据、怎么数据,还有
往上走就是HCIP-Big_Data_Developer_V1.0,这个阶段重点是开发。讲了怎么清洗数据、怎么集成、还讲了不少Spark的实时技巧。动手部分也蛮扎实,有不少Java
和Python
的开发练习,适合有点编程基础的同学,学完能自己做点像样的项目。
再进阶到HCIE-Big_Data系列,内容一下就深了不少。不只是教你怎么写代码,更多是在讲大数据系统怎么设计,比如架构规划、安全策略、平台调优这类内容。如果你以后打算搞大数据方向的架构或管理,这部分别跳过。
提一下里面的Data_Mining_V2.0教材,聚焦在数据挖掘这块。啥是特征工程、分类算法、聚类模型这些全都有,甚至还涉及了深度学习的入门内容,比如用TensorFlow
和Keras
做模型调参和训练,比较实用。
,教材和实验手册配套得还挺好,从工具用法到思维方式都顾到了。如果你是想在大数据方向长期发展的,华为这套资料还是蛮值得啃一啃的。如果你要看具体内容,下面这些资料可以直接下载:
- 基于 Hadoop 的大数据编程
- MapReduce 离线
- 华为大数据技术与应用
- 华为 HCIE 课程教材
- FusionInsight HD 方案
- MapReduce API 操作示例
- MapReduce 服务课程资料
如果你刚入门,可以从HCIA那套开始,边看边练更容易理解;要是你已经有一定基础,直接挑战HCIP或HCIE也完全 OK。