Weka 的可视化工作台,功能还蛮全的,适合刚入门数据挖掘的朋友。
Explorer 界面能直接拖数据进去,不用写代码就能跑模型,像分类、聚类都能试一圈。你要是懒得动手调参,Experimenter 还能帮你自动比较不同算法,挺省心的。
比如你想试下决策树,选个C4.5算法点两下就跑完,结果清晰明了。想挖掘数据之间的关系?K-means聚类点点鼠标就搞定,响应也快。
预那块也挺实用,像RemoveUseless
可以直接丢掉没啥用的字段,NominalToBinary
还能帮你名义变量,后面跑模型的时候更稳。
要是你搞不懂 SVM 怎么调参,或者不知道哪个模型更准,直接用Experimenter跑个批量测试,精度、召回率、F1分数通通一览无遗。
哦对了,Weka 还支持命令行操作,写个脚本批量跑也不是事儿。想系统学一下?去看看ExplorerGuide-3.5.5.pdf
和ExperimenterTutorial-3.5.3.pdf
,上手更快。
如果你刚开始接触机器学习,不想折腾太多代码,可以先用 Weka 玩一玩,逻辑清楚,功能也比较全面,练手不错。