为数据而生的大数据实践,内容挺硬核,但写得不枯燥,蛮适合前端或者全栈开发了解后端数据的那一套逻辑。像是从啥是大数据讲起,一路聊到 Hadoop、Spark 这些听得多但不一定熟的技术,顺带举了不少企业实战的例子,看完脑子里就能有个完整的架构图了。还有对 NoSQL 的、数据安全的点也比较细,尤其适合想从系统角度理解数据流程的你。哦对,里面关于数据中台的部分挺有意思,阿里的做法说得蛮实在。
为数据而生大数据实践指南
相关推荐
Redis大数据实践指南
Redis大数据之路PDF文档,由唐福林编著。本指南提供Redis快速入門教程。
Redis
8
2024-04-30
Pig 大数据实践指南
探索 Pig 的实战应用,掌握大数据处理的强大工具。
Hadoop
11
2024-04-30
阿里巴巴大数据实践指南
深入探讨阿里巴巴旗下淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业等业务领域的大数据实战案例。涵盖 MaxCompute、Hadoop 等技术,助力企业在 2020 年掌握大数据实践真谛。
Hadoop
14
2024-04-29
大数据实战指南
本手册涵盖大数据入门基础,包含 Hadoop 环境部署、核心组件 HDFS、MapReduce、流式计算框架 Storm 和数据挖掘相关知识。
Hadoop
18
2024-05-13
Hadoop大数据实战
深入解析Hadoop原理和特性,掌握实用技术和集群搭建技巧。
Hadoop
15
2024-04-30
大数据实践—Storm流计算实时异常监控
采用Storm流计算构建日志收集系统,实时汇聚日志数据,并结合离线数据分析,通过预先设定的规则对数据进行异常监测,实现实时告警和及时响应。
算法与数据结构
23
2024-04-30
大数据实验实验六:Spark初级编程实践
Spark是一个大数据处理的开源cluster computing框架,具有高效、灵活、可扩展等特点。本实验报告通过Spark初级编程实践,掌握Spark的基本使用和编程方法。
一、安装Hadoop和Spark
在Windows 10上安装Oracle VM VirtualBox虚拟机,安装CentOS 7操作系统,并配置Hadoop 3.3环境。选择支持Hadoop 3.3版本的Spark安装包,解压后配置spark-env.sh文件,成功启动Spark。
二、Spark读取文件系统的数据
Spark可以读取Linux系统本地文件和HDFS系统文件。首先,在spark-shell中读取Lin
spark
17
2024-07-12
大数据治理实践指南
大数据治理的工具书我还真得推荐一本——《大数据治理》。结构清晰、内容系统,不光讲了治理框架,还覆盖了五类大数据怎么管,怎么用。
大数据平台的底子打得好,后面、可视化才靠谱。不然数据再多,也是一团乱麻。像你要做企业数据治理,或者搭建政务数据平台,这本书都挺有参考价值。
书里讲的技术也蛮全的,从Hadoop、Spark到IBM InfoSphere,还有实际案例,比如电商、医疗、政府的用法。对刚入门或者想搭平台的同学来说,还挺友好的。
我顺手整理了几个资源,想动手搭平台或者写方案的可以看看:
数据采集+治理++可视化平台:搭平台的好模板
大数据治理全流程指南:做流程设计可以参考
IB
算法与数据结构
0
2025-06-26
大数据实验总结_全部
本次的大数据实验总结报告涵盖了对多个大数据组件的配置和部署经验,从torque到hbase,涉及了实验的概述、配置细节、安装步骤、环境配置及心得体会等关键知识点。实验的核心在于搭建一个高效的大数据处理平台,以支撑大数据的存储、计算及分析任务。 ###实验概述实验的目的是在五台主机上分别配置torque、mpich、mongodb、hadoop、zookeeper和hbase,并将它们集成到一个集群环境中。实验过程涵盖了集群的搭建、测试以及问题的排查解决。 ### torque配置Torque是一个集群资源管理器,提供了集群的调度、资源监控等功能。配置过程包括安装server和客户端,设置mas
Hadoop
0
2025-06-25