Weka 的数据模块挺齐全的,像Explorer
里的Preprocess
,能直接做属性选择,点几下就能筛出关键特征,蛮适合新手上手的。
分类预测用Explorer – Classify
搞定,常见的算法基本都带了,还能直接看准确率、混淆矩阵那种。想跑多个算法比较下效果?用Experimenter
就行,配置下批,效率高多。
聚类、关联规则也能直接在Explorer
里选,像Cluster
、Associate
这两个模块,界面操作直观,不用写啥代码就能出结果,嗯,挺适合做快速验证的。
可视化方面也不错,Visualize
里能看二维散点图,对聚类结果一目了然,颜色分类清晰。还可以试试KnowledgeFlow
,批量学习、增量模式都能跑,适合数据量比较大的场景。
建议你在用Preprocess
做清洗时,搭配下面这几篇文章看看,比如属性选择教程讲得还不错,还有这个Weka 预 PPT,步骤清晰,照着做基本不会错。
如果你想深入学下聚类,可以看看聚类指南,里面还提了点电力负荷预测的例子,实战性蛮强。