广义线性支持向量分类机的实战,讲得还挺接地气的,尤其是和 SPSS-Clementine 结合那一块,适合你这种既搞算法又玩可视化工具的朋友。模型训练流程也不绕,直接讲怎么选惩罚参数,怎么优化求解,不烧脑。
惩罚参数的选法其实就是调模型对错分样本的容忍度,调大了容易过拟合,调小了泛化好但精度低。建议你先用默认值跑一轮试试,效果不行再慢慢调。
支持向量机本身蛮适合做二分类任务,比如客户流失预测、信用卡欺诈检测这类问题,在SPSS-Clementine
里还能可视化流程,挺适合快速上手的。
如果你平时也用matlab
做实验,推荐你看看这个SVM 分类与回归的 matlab 程序,代码不多,但挺实用,尤其是搞研究用来打基线。
对了,初学者别一下子冲太深,先把原理吃透,尤其是间隔最大化和核函数的概念。理解了这些,用工具跑就简单了。
如果你在做数据挖掘项目,又想试试图形化操作,不妨上手这个资源,蛮省事的。