Java 项目里要搞点数据挖掘的活儿,用Weka还挺顺手的。只要把weka.jar
扔进classpath
,基本就能跑起来。
在Eclipse里操作也简单,右键项目名,选Build Path → Add External Archives
,点开weka.jar
就行,几步搞定。
Weka其实是个专门做数据挖掘的 Java 库,像分类、聚类、特征选择这些常见任务都能搞,而且封装得还挺人性化。你不用从零造轮子,直接调用方法就能出效果。
如果你在搭配Hadoop、Jedis这些用来做大数据或者缓存的项目,Weka 也能混得进去,写点模型、跑跑测试,方便。要是感兴趣,可以顺便看看下面那篇《Java 集成 Weka 类库指南》,写得比较细。
哦对了,用的时候别忘了版本对得上,Weka的 jar 版本跟 JDK 最好别差太远,免得出现兼容问题。
如果你想更深入一点,比如看看它背后的算法实现,或者扩展插件,也都挺开放,文档也不算少。