广义线性支持向量分类机数据挖掘与SPSS-Clementine应用

广义线性支持向量分类机的实战，讲得还挺接地气的，尤其是和 SPSS-Clementine 结合那一块，适合你这种既搞算法又玩可视化工具的朋友。模型训练流程也不绕，直接讲怎么选惩罚参数，怎么优化求解，不烧脑。

惩罚参数的选法其实就是调模型对错分样本的容忍度，调大了容易过拟合，调小了泛化好但精度低。建议你先用默认值跑一轮试试，效果不行再慢慢调。

支持向量机本身蛮适合做二分类任务，比如客户流失预测、信用卡欺诈检测这类问题，在SPSS-Clementine里还能可视化流程，挺适合快速上手的。

如果你平时也用matlab做实验，推荐你看看这个SVM 分类与回归的 matlab 程序，代码不多，但挺实用，尤其是搞研究用来打基线。

对了，初学者别一下子冲太深，先把原理吃透，尤其是间隔最大化和核函数的概念。理解了这些，用工具跑就简单了。

如果你在做数据挖掘项目，又想试试图形化操作，不妨上手这个资源，蛮省事的。