Mac 上的 Weka 挺方便的,安装简单,点几下就能跑起来。界面也还不错,拖拖点点就能选算法、跑模型,适合不太会编程但又想做点数据的朋友。支持的算法也多,像决策树、SVM、聚类那一套全都有。
Weka 的算法库挺全的,分类、回归、聚类一应俱全,像J48
决策树、NaiveBayes
、SMO
(就是支持向量机)都能直接用。参数也能调,调完还可以跑交叉验证。
数据预这块也比较贴心,缺失值、异常值清洗,特征选择、标准化、归一化都有,界面上点点就行。你可以直接导入.arff
或.csv
文件,完再选算法。
可视化也不赖,图表都能自动生成,模型训练完后看一下分类边界、准确率、召回率啥的,一目了然。还可以对比不同算法的表现。
安装也蛮简单,从官网下载 Mac 版,解压后把Weka.app
拖到应用程序里就能用了。启动时要输入一下密码,之后每次都能直接点开。
应用场景也挺多的,比如你做市场,可以用它找出哪些用户更容易下单;做生物信息,也能找基因数据里的模式;搞社交,也能看用户之间的关系。
想深入学的话,建议去看看Weka 的官方,还有机器学习相关资源也蛮实用。
如果你在 Mac 上想练练数据,又不想写太多代码,那 Weka 真是个不错的入门工具。