广义线性支持向量分类机的实战,讲得还挺接地气的,尤其是和 SPSS-Clementine 结合那一块,适合你这种既搞算法又玩可视化工具的朋友。模型训练流程也不绕,直接讲怎么选惩罚参数,怎么优化求解,不烧脑。

惩罚参数的选法其实就是调模型对错分样本的容忍度,调大了容易过拟合,调小了泛化好但精度低。建议你先用默认值跑一轮试试,效果不行再慢慢调。

支持向量机本身蛮适合做二分类任务,比如客户流失预测、信用卡欺诈检测这类问题,在SPSS-Clementine里还能可视化流程,挺适合快速上手的。

如果你平时也用matlab做实验,推荐你看看这个SVM 分类与回归的 matlab 程序,代码不多,但挺实用,尤其是搞研究用来打基线。

对了,初学者别一下子冲太深,先把原理吃透,尤其是间隔最大化核函数的概念。理解了这些,用工具跑就简单了。

如果你在做数据挖掘项目,又想试试图形化操作,不妨上手这个资源,蛮省事的。