数据挖掘的玩法,SQL Server 2005 其实也能搞挺多事的。这本《数据挖掘原理与应用》讲得还蛮系统,不光是讲了功能怎么用,还带了不少实战经验,读下来不会只停留在概念层面。
SQL Server 2005 的数据挖掘工具,说实话在那个年代就已经挺强了。这本书讲了像决策树、聚类、关联规则这些模型怎么玩,重点是讲得比较接地气,配了不少操作截图和实际例子。
比如说你想从一个销售表里挖出用户购买行为,用内置的挖掘模型搞一搞就能得出“买 A 的率也会买 B”这种。用到的 SQL 也不复杂,多时候一条 SELECT * FROM ... PREDICTION JOIN
就能搞定。
里面还有不少最佳实践,比如模型怎么调、怎么缺失值、如何结合 Excel 或 SSIS 搞自动化流程,这些点都比较实用。顺手也可以看看这篇实践文章,对照着书来学更快。
顺带一提,要是你平时爱用 Excel,那这篇《将 Excel 数据导入 SQL Server 2005 的最佳实践》也可以看看,配合书里的流程用,还挺方便。
还有个小建议,SQL 写数据挖掘相关语句的时候尽量加注释,不然回头再看容易一脸懵,尤其是用到比较复杂的 JOIN 或嵌套查询那种。
如果你对数据感兴趣,但又不想上来就搞 Python 那一套,SQL Server 这套工具其实蛮适合入门的。多试几次你就会发现,其实不难。