本手册涵盖大数据入门基础,包含 Hadoop 环境部署、核心组件 HDFS、MapReduce、流式计算框架 Storm 和数据挖掘相关知识。
大数据实战指南
相关推荐
Hadoop大数据实战
深入解析Hadoop原理和特性,掌握实用技术和集群搭建技巧。
Hadoop
15
2024-04-30
Hadoop大数据实战宝典
课程内容
HBase案例分析
MapReduce 高阶应用
多语言 MapReduce 编程
Chukwa 集群监控系统
Greenplum 架构解析
Flume 日志收集系统实战
视频教学
课程包含详细的视频教程,助你快速入门Hadoop大数据技术。
Hadoop
13
2024-05-19
Hadoop大数据实战手册
从 Hadoop 的文件系统到 MapReduce 的任务分发,再到 Hive 的 SQL 式操作和 HBase 的 NoSQL 特性,《Hadoop 大数据实战手册》这本书把大数据的玩法讲得挺透。作者算是老江湖了,写的不是那种空谈理论的书,里面全是踩坑总结和实战案例,拿来就能用。你要是刚入门大数据或者打算跳槽进这行,这本书真的还蛮值的。
HDFS 的分布式存储搞得挺清楚,安装配置一步步写了,照着来不容易出错。MapReduce 这块,例子也多,像map()和reduce()的函数结构,讲得比较直白,看一眼就知道干啥。
再说Hive,有 SQL 基础的朋友上手快,抽象层做得不错,连表结构都能像
Hadoop
0
2025-06-15
云计算大数据实战详解
循序渐进掌握云计算大数据离线计算,了解编程步骤的每一个细节。
算法与数据结构
20
2024-05-13
华为金融大数据实战方案
华为金融大数据解决方案实战运用,可作为金融大数据客户汇报素材。
Hadoop
11
2024-05-20
大数据实战系列探索(持续更新)
在本大数据实战系列中,我们将深入探讨大数据处理的核心概念和关键技术,这些技术在当今信息化社会中具有重要意义。大数据不仅仅是海量数据的处理,更是如何高效地从中获得有价值的见解。参与者将有机会亲自实践,深入体验大数据的魅力。基础架构通常基于Hadoop生态系统,包括开源的HDFS和MapReduce。HDFS是分布式文件系统,将数据集分块存储在多台服务器上,提供高容错性和可扩展性。MapReduce是一种并行处理模型,用于生成和处理大规模数据。搭建大数据平台需要下载Hadoop发行版,配置环境变量,并正确设置核心配置文件如core-site.xml、hdfs-site.xml和mapred-sit
Hadoop
15
2024-07-26
Mastering Apache Spark大数据实战宝典
Apache Spark 的进阶宝典《Mastering Apache Spark》还挺值得推荐给搞大数据的你。内容覆盖面广,从基础的Spark Core到实战级的Structured Streaming、MLlib、GraphX都有讲,细节拉满。是机器学习那一块,ML Pipelines搭建工作流挺有意思,像StringIndexer和Tokenizer这种工具用起来贼顺手。书里还讲了模型评估和调优,像CrossValidator、BinaryClassificationEvaluator这些都讲得明白。用 Spark 做流?书里有详细例子,结合Structured Streaming模块,
spark
0
2025-06-15
Redis大数据实践指南
Redis大数据之路PDF文档,由唐福林编著。本指南提供Redis快速入門教程。
Redis
8
2024-04-30
Pig 大数据实践指南
探索 Pig 的实战应用,掌握大数据处理的强大工具。
Hadoop
11
2024-04-30