Windows 下的安装包,weka-3-5-8.exe
是老版本里的口碑款。界面是 Swing 风格的,嗯,虽然看起来有点复古,但功能挺全的。你想做分类、聚类、甚至挖点关联规则,它都能搞定。
用 Weka 跑个分类模型快。像用 J48 跑决策树,选好数据集点一下就能出图,不用写一堆代码,配置选项也比较直观。适合快速验证思路,不想动 IDE 的时候用它还挺爽。
关联规则挖掘功能也不赖,比如 Apriori 算法,简单设个支持度、置信度,点运行就完事儿了。你可以看看WEKA 关联规则挖掘教程,讲得比较细,适合新手入门。
还有聚类功能,k-means、EM 啥的都能用,用来跑实验数据挺方便。对比几个算法看看效果差异,一点都不费劲。哦对,聚类与距离度量那篇也挺有参考价值。
要提醒一下,虽然它支持 ARFF、CSV 这些格式,但你导入前最好用 Weka 自带的工具转一下格式,避免出错。arffviewer
可以预览数据格式,省得运行时报错一脸懵。
如果你想调算法参数,可以看看Weka 关联规则挖掘参数设置实战,写得蛮实用的。尤其是做实验时多调几个参数组合,效果差多。
,weka-3-5-8属于那种你不会天天用,但放在工具箱里挺安心的类型。要跑点小实验、课堂演示、教学演示,完全够用。