协作数据的 R 语言项目,内容还挺系统的,尤其适合准备程序员考试或者做社会科学方向的你。HertieDataScience 的这个课程资源,讲的就是怎么用 R 来收集、社会数据,还教你怎么把结果用网络形式展示出来,挺实用的。
课程结构比较清晰,主要围绕 R 语言 和 协作数据科学 来展开。像 dplyr
、ggplot2
这些库都用得上。你会学到怎么做 reproducible 的项目,版本控制也有涉及,基本能跟科研或项目开发直接接轨。
文档是 2016 年秋季的老版本,但核心内容一点不旧。数据清洗、可视化、团队协作这三点讲得比较透,是对新手来说,有个系统的流程挺重要。R 的一些坑,比如 factor 类型,也顺带提到了。
相关链接我也挑了一些,像R 语言数据、空间数据绘图这些,都蛮有参考价值。如果你刚入门 R 或是想提高数据可视化的表达能力,可以顺便看一看。
提醒一下哦,如果你在企业搞金融、市场、数据产品,这套内容也不是只对学术圈有用。尤其是要做可视化报告那块,用 Shiny
或 rmarkdown
输出给老板看,效果会好不少。
如果你正在找一套能实战、能刷题、还能学技能的资源,可以去看看这个课程。配合文章里推荐的那几个 R 教程,吸收起来也轻松不少。