《大数据及应用实践》的教学资源还是蛮实用的,尤其是你搞大数据开发或者教学的话,绝对值得一看。整个压缩包里不仅有教学课件,还有课程标准,方便你对照着规划教学内容。

大数据的基础知识讲得比较清楚,像那什么“4V”特征——VolumeVelocityVarietyVeracity,都配了图文例子,学生看了不迷糊。

数据部分也还不错。重点讲了 HadoopSpark,配套的实验挺实战,比如用 MapReduce 跑一段清洗逻辑,或者用 Spark Streaming 弄个实时统计页面。

讲到 数据预,清洗、缺失值那一块内容挺扎实,而且用 PythonR 写的例子都有,代码注释也比较详细,抄起来直接用都行。

存储这块不止讲了 MongoDBCassandra,还补了关系型的 MySQL,对比讲得挺清楚,知道啥场景选啥库。

方法讲到了几个经典机器学习模型,像 线性回归随机森林SVM,还顺带提了点 神经网络。不过别担心,通俗易懂,不烧脑。

可视化这部分了 TableauPower BI 的基本操作,附的截图+一步步来,比较适合新手入门。

课程标准文件对教学目标、实验要求写得比较细,适合做教学设计或者写课程大纲。

压缩包里还藏了个 customXml 文件,内容蛮有意思,像是定制学习路径、教学资源啥的,可以拿来参考,或者照着格式做自己的定制也行。

如果你正好在备课,或者想搞个完整的 大数据教学框架,可以考虑用这份资料搭底子,再结合下面这些相关文章,提升一下整体实战性。