数据用 R,真的是越用越顺手。R 语言的语法上手挺快,内置的统计函数也丰富,适合搞数据挖掘的朋友。这个资源讲得蛮系统的,从基础到进阶,全套打包,不怕你不会,只怕你不学。
数据导入和清洗部分实用,像用readr
读 CSV、dplyr
做变量选择这些,平时数据经常用到,响应也快,代码也简洁。嗯,还有tidyr
缺失值也顺手,结合ggplot2
做点 EDA,图漂亮,信息也全。
分类和回归这块也讲得不错,从rpart
、randomForest
到glm
、岭回归都有涉及,连交叉验证、ROC
和AUC
这些指标评估都有讲,挺系统的。聚类也安排上了,kmeans
和hclust
都能找到例子。
你要是搞时间序列,也别错过这部分内容。像ARIMA
建模、用tsibble
和fable
做预测都讲得比较清楚,思路也比较实用。还有集成学习,比如xgboost
、AdaBoost
也顺带提了,适合想进阶的同学试试。
哦对了,它还讲了用R Markdown
写报告,适合你整理项目、写结题总结啥的,图文混排挺方便。要练手的话,推荐把它配套的代码跑一遍,效果更好。如果你想提升用 R 搞数据的效率,这资源值得收藏。