研究生期间的 R 语言作业项目,其实还挺有意思的。项目文件名叫r_nuan,就是“R 语言的温度”那种感觉,听着就不冷冰冰,蛮有温度的。这个项目基本上涵盖了 R 语言常用的那一套:数据导入、清洗、建模、作图啥的都有。

数据部分用的比较多的像read.csvis.na这些基础函数,搭配as.numericas.Date做类型转换,写起来比较顺手。清洗部分做得挺细的,像缺失值、异常值都有考虑,不是那种一股脑就建模的流程。

统计也挺全,线性回归lm广义线性模型glm,聚类也玩了点kmeanshclust。如果你之前用过caret做模型调参,会觉得这里的流程还蛮清晰的。

作图方面,基础绘图函数plothist用得比较频繁,也少不了ggplot2这种好用的可视化神器。想画点好看点的图,用facet_wrap或者theme_minimal也挺方便。

项目整体上,逻辑清晰,代码也没啥废话。还有一点不错的地方是,它也涉及了点包开发的思路,像用source组织代码、试着用devtools来模块化,挺适合进阶的同学试水。

如果你正好在摸索 R 语言、想整点实战项目练练手,这份代码还挺值得参考的。嗯,尤其是你在数据科学、统计方向想走深一点的话,可以从里面学不少思路。