SQL Server 的挖掘插件套装,真挺适合经常和 Excel、Visio 打交道的数据师。

SQL Server 2008 DataMining Add-Ins for Microsoft Office 2007 的Excel 表工具,功能挺全的,像什么回归、聚类、关联规则这些,直接在 Excel 里点两下就能跑。不用写代码,响应也快,挺适合不想折腾太多的人。

数据预、模型构建、验证啥的,它都能搞定。而且界面做得还行,交互性强,不熟悉建模的人也能慢慢上手。就比如你要筛掉异常值、转化字段啥的,直接点选就完事儿了。

Excel 数据挖掘客户端是另一个亮点,连接SQL Server Analysis Services顺,不用手写 MDX 语句,省心不少。你可以直接创建决策树神经网络朴素贝叶斯这些模型,还能一键部署到服务器,测试也方便。

不光是做模型,它还支持模型可视化,结果图形化展现出来,非技术人员也能理解,比如老板看报告更直观。嗯,像预测客户流失用户分群这种场景,Excel 加它就够用了。

还有Visio 数据挖掘模板,这个就比较偏向视觉表达了。你可以把模型结果直接拖成组织图流程图那种,图形一摆,数据关系一下就看清楚。像流程审批路径优化、业务流程这些场景,合适。

安装方式也简单,直接跑SQLServer2008_DMAddin.msi就好,会自动集成进 Office 里。不过注意要先装好SQL Server Analysis Services,它多算法和服务都靠它跑。

如果你平时用 Office 做数据工作,又对数据挖掘感兴趣,这套 Add-Ins 可以说是个不错的上手工具。省了多环境搭建、脚本编写的麻烦,还能比较快地看到结果,挺适合做业务的你。