用 R 语言搞数据挖掘的利器,Machine Learning with R还挺适合前端同学了解数据那一套的。数据清洗、建模这些步骤,都能一步步来,代码也不复杂。配上几个实用的入门文章,边看边练,效果还挺不错。
R 语言的包生态挺成熟,像caret
、randomForest
这种模型工具,封装得比较好,适合不想写太多底层逻辑的你。比如用caret
训练个分类模型,一行代码就能跑起来,响应也快。
建模过程的可视化也算是 R 的强项,像ggplot2
、lattice
这些可视化工具,输出的图表蛮清爽,调参的时候直观。适合那种喜欢用图感受数据趋势的朋友。
新手上手的话,推荐先看这篇《使用 R 语言入门机器学习》,对流程讲得比较清楚。可以看看《数据挖掘机器学习》,理解下模型背后的逻辑。
嗯,还有一篇《机器学习常用开源数据集及数据挖掘、机器学习、深度学习的区别》,虽然听着有点长,但看完后你会更清楚这几个概念到底差在哪。
如果你平时主要写前端,偶尔需要搞点数据、跑个小模型,R 还是挺合适的,代码量不大,学习曲线也不算陡。