研究生期间的 R 语言作业项目,其实还挺有意思的。项目文件名叫r_nuan
,就是“R 语言的温度”那种感觉,听着就不冷冰冰,蛮有温度的。这个项目基本上涵盖了 R 语言常用的那一套:数据导入、清洗、建模、作图啥的都有。
数据部分用的比较多的像read.csv
、is.na
这些基础函数,搭配as.numeric
或as.Date
做类型转换,写起来比较顺手。清洗部分做得挺细的,像缺失值、异常值都有考虑,不是那种一股脑就建模的流程。
统计也挺全,线性回归用lm
,广义线性模型用glm
,聚类也玩了点kmeans
和hclust
。如果你之前用过caret
做模型调参,会觉得这里的流程还蛮清晰的。
作图方面,基础绘图函数像plot
、hist
用得比较频繁,也少不了ggplot2
这种好用的可视化神器。想画点好看点的图,用facet_wrap
或者theme_minimal
也挺方便。
项目整体上,逻辑清晰,代码也没啥废话。还有一点不错的地方是,它也涉及了点包开发的思路,像用source
组织代码、试着用devtools
来模块化,挺适合进阶的同学试水。
如果你正好在摸索 R 语言、想整点实战项目练练手,这份代码还挺值得参考的。嗯,尤其是你在数据科学、统计方向想走深一点的话,可以从里面学不少思路。