Java 里用Weka做数据挖掘还挺方便的,重点是引入方式简单。你只要把weka.jar
扔进项目的classpath
里就行了。在Eclipse里操作也不麻烦,右键项目 -> Build Path -> Add External Archives,找到weka.jar
一加,搞定。
Weka 里封装了不少算法,分类、聚类啥的都有,自己写太费劲,直接调它的 API 就好。适合搞点原型验证、小项目试试水,或者你想快速跑个模型看效果,也挺适合。
不过要注意,Weka对数据格式要求比较死,.arff
用得多,CSV 也能支持,但格式得得当,不然老是报错。数据预得走一遍,别想一步到位。
另外,如果你用的不是 Eclipse,而是 Maven 项目,那建议就别手动加 jar 了,直接在pom.xml
里引入 Weka 的依赖,省心不少。
哦对了,如果你还在整其他数据工具,下面这些 JAR 包你也用得上:比如Kafka、Redis、MySQL等,一样是手动导入或 Maven 引。