Spark SQL 的学习笔记,内容还挺扎实的,适合刚上手或者回炉复习的你。不光讲了基础概念,还带了不少实用例子,比如怎么建 Hive 表、怎么用 Beeline 连 ThriftServer,细节拉满。像DataFrame
和Dataset
的区别也讲得比较清楚,配合代码块看着顺手,理解起来也轻松不少。
Spark SQL学习笔记
相关推荐
学习 Apache Spark 笔记
这是一个学习 Apache Spark 的共享资源库。最初由 [Feng2017] 在 Github 上发布,主要包含作者在 IMA 数据科学奖学金期间的自学笔记。
该资源库力求使用详细的演示代码和示例来演示如何使用每个主要功能。
这些教程假设读者具备编程和 Linux 的基础知识,并以简单易懂的教程和详细示例的形式分享 PySpark 编程知识。
数据挖掘
9
2024-05-23
Apache Spark学习笔记
基于内存的分布式计算框架的 Spark,挺适合搞大数据的你研究一下。RDD是它的核心概念,说白了就是一套能并行数据的抽象模型,灵活又高效。用它的时候你不需要操心太多底层的存储和调度,逻辑封装完,Spark 自己会生成Task交给Executor去跑,响应也快。
RDD 的弹性挺关键的,比如它不保存数据本体,只保留逻辑,这样一出事能自动恢复,减少你调 bug 的痛苦。而且它是不可变的,每次改操作都生成新的RDD,这点对数据一致性友好。
常用操作方面,像groupBy、reduceByKey这些算子,还挺常用。比如你要按用户聚合访问日志,直接groupBy就搞定。如果你要减少分区数量,coales
spark
0
2025-06-16
Spark2.4.0学习笔记
分享Spark2.4.0学习笔记,欢迎查阅
spark
17
2024-04-30
SQL 语句学习笔记
在达内培训期间,我整理了自己学习 SQL 语句的笔记,希望能够对你有所帮助。
Oracle
12
2024-05-25
SQL Server 学习笔记
这些笔记整理了我学习 SQL Server 时的重要知识点,帮助初学者快速入门并理解 SQL Server 的核心概念。
SQLServer
11
2024-05-31
SQL基础学习笔记
SQL 学习笔记挺适合刚入门的小伙伴,内容简洁明了,知识点一目了然,适合用来快速查漏补缺。笔记里了创建表、插入数据、删除数据、更新数据和查询数据的基本操作,几乎涵盖了日常开发过程中常用的 SQL 语句。而且,每个小节都有详细的示例,起来还蛮直白的,做起来也不难,容易理解。如果你刚开始接触 SQL,这份笔记应该能帮你理清操作流程,也避免了多常见的错误。
比如,插入数据时,你可以选择插入部分字段,像这样:
INSERT INTO student (name, age, sex) VALUES ('zhang', 20, '');,或直接插入所有字段,不必担心遗漏。
,笔记里还提醒了,执行删除数据操
MySQL
0
2025-06-18
Head First SQL学习笔记
第一章:创建数据库CREATE DATABASE database_name;使用数据库USE database_name;创建表CRATE TABLE table_name ( col2 VAR_TYPE, col1 VAR_TYPE NOT NULL DEFAULT xxx, );删除表DROP TABLE table_name;显示表DESC table_name; DESCRIBE table_name;插入数据INSERT INTO table_name (col1, col2) VALUES (col1_val, col2_val),还有其他插入数据的方法,不一一详述。
SQLServer
9
2024-07-30
SQL Server 2005学习笔记
这是我整理的关于SQL Server 2005的笔记,内容十分详尽,希望大家能够好好利用!
SQLServer
12
2024-08-17
SQL语言学习笔记
SQL是一个高性能的多线程结构化查询语言数据库服务器。它是全球最流行的数据库语言之一,MySQL具有出色的执行性能和快速运行速度,使得SQL的学习入门变得非常容易。
SQLServer
12
2024-07-26