算法工具的横向对比挺少见的,尤其是把数据仓库和数据挖掘主流平台像Clementine
、Darwin
、Enterprise Miner
、Intelligent Miner
这些放一块来的。对你要选工具做项目还是了解各家强项,参考价值都挺高。
决策树、神经网络、回归、聚类这些主力算法,在不同平台上支持情况不一样。有的全都有,有的比如PRW
,就偏轻量,支持的算法蛮少。你要是正在纠结选哪家工具,不妨看看这个对比表。
顺手给你推荐几篇蛮实用的文章,像 MapReduce 决策树研究 这篇,用大数据场景跑树模型;还有 构建决策树模型,从思路到代码讲得比较清楚,适合入门。如果你是 Python 党,可以直接上 Python 实现决策树模型解析,用起来方便,调试也直观。
哦对了,SPSS-Clementine 的应用技巧也不错,对那套工具链熟悉点的可以看看。还有压缩包版本的资源也别错过,比如 决策树.zip。
如果你刚好在选型或者要写个算法综述,那这份比较表和这些配套资源真心省不少事。用的时候注意版本差异,有的功能在旧版里不太一样。