weka 的安装包里自带源码,weka-src.jar
解压就是,想看内部实现或者自己改点东西方便。机器学习算法基本都有,分类、回归、聚类,甚至关联规则挖掘都支持,挺全的。界面虽然有点老,但操作上手快,试个算法啥的也就几分钟事儿。
源码结构比较清晰,接口设计得还不错。如果你打算自己实现算法,参考它的接口文档是个不错的起点。比如你要自己写个分类器,继承Classifier
类再实现几个方法就差不多能跑了。想深入点的,还可以做些可视化工具扩展,思路上也挺适合抄的。
有一本书《数据挖掘:实用机器学习技术》配套讲得细,里面的例子几乎都能直接跑在 weka 上。哦对了,weka是新西兰的一种鸟,工具名也挺有意思,主创团队就在新西兰。
如果你想要下载 3.5.8 版本,直接搜weka 3.5.8 下载
就能找到。或者参考这个论坛贴也行:http://www.pinggu.org/bbs/viewthread.php?tid=619834&;page=1,里面讲得挺详细的。
另外几个相关文章也推荐看看:
数据挖掘机器学习
机器学习软件 WEKA 详细
常用开源数据集和算法区别
如果你是想找个轻量的图形化工具跑机器学习算法,weka真的还蛮适合的。安装简单、源码开放、接口友好,用起来也不重。想快点上手机器学习的,值得一试。