是在蒋良孝老师指导下完成的课程报告。报告涵盖了四个改进思路:1. 通过查阅论文、自行思考和实验验证后完成;2. 源码位于Weka的src/main/java/weka/classifiers/wangliyu/ID3
,包含报告前三个改进思路的代码,可供参考;3. 上传此文为有需要的同学提供一些指导。
数据挖掘(机器学习)课程报告及Weka源码及相关论文
相关推荐
机器学习常用开源数据集及数据挖掘、机器学习、深度学习的区别
机器学习常用开源数据集
在进行机器学习项目时,使用真实数据至关重要。许多开源数据集涵盖了多个领域,为机器学习研究和应用提供了丰富的资源。
寻找开源数据集的途径:
数据仓库平台: 许多平台专门收集和整理开源数据集,例如 Google Dataset Search、Kaggle Datasets、UCI Machine Learning Repository 等。
相关领域网站: 许多研究机构或组织会发布自己领域内的开源数据集,例如医疗、金融、图像识别等。
数据挖掘、机器学习、深度学习的区别
数据挖掘 侧重于从数据中发现模式和规律,并利用算法模型进行分析。其核心目标是揭示数据变量之间的关系,
数据挖掘
15
2024-07-01
清华机器学习与数据挖掘课程项目
此存储库包含我完成的清华大学机器学习和数据挖掘课程项目。
数据挖掘
21
2024-05-13
Coursera机器学习课程Matlab代码及曲线
此资源涵盖了斯坦福大学Andrew Ng在Coursera平台上教授的机器学习课程,需要约60小时的学习时间投入。课程通过实践教学介绍了机器学习的基础知识,包括线性回归、逻辑回归、神经网络和支持向量机等常见的有监督学习算法。此外,还涵盖了偏差和方差、L2正则化、误差指标以及学习/验证曲线等概念。课程还包括无监督学习算法如k均值聚类和降维技术。最后,课程介绍了推荐系统和大规模机器学习的相关内容。
Matlab
19
2024-08-18
数据挖掘机器学习
使用 Spark、PySpark、Spark 管道、Jupyter Notebook 学习数据挖掘机器学习
数据挖掘
18
2024-05-15
Weka: 基于Java的开源机器学习与数据挖掘平台
Weka (怀卡托智能分析环境) 是一款开源的机器学习和数据挖掘软件,基于Java环境开发。它提供数据预处理、关联规则分析等功能,是SPSS Clementine等商业软件的免费替代方案。
算法与数据结构
11
2024-05-31
机器学习及深度学习笔记算法与数据挖掘实用手册
机器学习方向的代码资源里,《机器学习及深度学习笔记》算是比较全的一个,内容覆盖从基础数学到深度模型推导,还夹杂了不少实用代码,调包也好,手写也行,反正就是手把手教你怎么搞。基础数学部分挺扎实的,像线性代数、概率论这些底层知识,不只是讲概念,还会结合算法怎么用,推公式也都讲得比较清楚,适合那种想搞懂底层逻辑的你。算法实现这块有意思,常用的分类、聚类、回归,每种都配了 Python 调包和手推版本,实用性还蛮强的。比如用sklearn一行就能搞定逻辑回归,再教你自己推一遍。配套的资源也挺多的,比如下面这几个文章:一个讲Python 实现的主流算法,一个梳理了常用开源数据集,还有一个主打表格数据的,
算法与数据结构
0
2025-06-30
Weka 3.5.8机器学习工具
weka 的安装包里自带源码,weka-src.jar解压就是,想看内部实现或者自己改点东西方便。机器学习算法基本都有,分类、回归、聚类,甚至关联规则挖掘都支持,挺全的。界面虽然有点老,但操作上手快,试个算法啥的也就几分钟事儿。
源码结构比较清晰,接口设计得还不错。如果你打算自己实现算法,参考它的接口文档是个不错的起点。比如你要自己写个分类器,继承Classifier类再实现几个方法就差不多能跑了。想深入点的,还可以做些可视化工具扩展,思路上也挺适合抄的。
有一本书《数据挖掘:实用机器学习技术》配套讲得细,里面的例子几乎都能直接跑在 weka 上。哦对了,weka是新西兰的一种鸟,工具名也挺有
数据挖掘
0
2025-06-30
Weka数据挖掘报告
详细介绍了Weka在关联分析、聚类分析、分类分析中的应用,并提供实验报告。
数据挖掘
14
2024-04-30
机器学习算法简介及分类
机器学习的发展中,有一条被称为“没有免费的午餐”定理。简单来说,它指出没有一种算法能够解决所有问题,尤其是在监督学习领域。
算法与数据结构
16
2024-07-17