《大数据及应用实践》的教学资源还是蛮实用的,尤其是你搞大数据开发或者教学的话,绝对值得一看。整个压缩包里不仅有教学课件,还有课程标准,方便你对照着规划教学内容。
大数据的基础知识讲得比较清楚,像那什么“4V”特征——Volume
、Velocity
、Variety
、Veracity
,都配了图文例子,学生看了不迷糊。
数据部分也还不错。重点讲了 Hadoop 跟 Spark,配套的实验挺实战,比如用 MapReduce
跑一段清洗逻辑,或者用 Spark Streaming
弄个实时统计页面。
讲到 数据预,清洗、缺失值那一块内容挺扎实,而且用 Python 和 R 写的例子都有,代码注释也比较详细,抄起来直接用都行。
存储这块不止讲了 MongoDB
和 Cassandra
,还补了关系型的 MySQL
,对比讲得挺清楚,知道啥场景选啥库。
方法讲到了几个经典机器学习模型,像 线性回归
、随机森林
、SVM
,还顺带提了点 神经网络。不过别担心,通俗易懂,不烧脑。
可视化这部分了 Tableau 和 Power BI 的基本操作,附的截图+一步步来,比较适合新手入门。
课程标准文件对教学目标、实验要求写得比较细,适合做教学设计或者写课程大纲。
压缩包里还藏了个 customXml
文件,内容蛮有意思,像是定制学习路径、教学资源啥的,可以拿来参考,或者照着格式做自己的定制也行。
如果你正好在备课,或者想搞个完整的 大数据教学框架,可以考虑用这份资料搭底子,再结合下面这些相关文章,提升一下整体实战性。