数据挖掘涉及发展、技术及其商业应用。适合入门学者和研究人员参考。
数据挖掘概览及商用方向
相关推荐
数据挖掘算法概览
数据挖掘算法概览
监督学习
分类
决策树
支持向量机
朴素贝叶斯
K近邻
逻辑回归
回归
线性回归
岭回归
Lasso回归
无监督学习
聚类
K-means
层次聚类
DBSCAN
关联规则挖掘
Apriori算法
FP-growth算法
其他
时间序列分析
文本挖掘
图挖掘
算法与数据结构
15
2024-05-25
数据挖掘软件发展概览
数据挖掘软件的发展讲得还挺全的,内容从早期工具说起,一直讲到现在主流的软件,适合刚入门或者准备选工具的朋友翻一翻。像是Minitab、SPSS、Eviews这些常见选手,都有对比和实际案例,比较贴地气,懂点 Excel 也能跟上。页面里还贴了不少资源链接,像Minitab 数据软件详解这种,点进去能看到软件截图和使用建议,蛮实用的,不像有些纯理论讲一堆听不懂。我觉得如果你想找一套合适的数据工具,但又不确定选哪个,先过一遍这份 PPT 思路会清晰多。哦对了,文档是 PPT 形式的,排版清爽,逻辑也清楚,看着不累。要是你已经用Python在,那也别急着跳过,里面还有像Python 数据经典应用与发
数据挖掘
0
2025-06-15
数据挖掘分类算法概览
数据挖掘分类算法概述
不同分类算法原理及特点对比
分类算法在实际中的应用举例
数据挖掘
13
2024-04-30
数据挖掘分类算法概览
分类清晰的数据挖掘算法,挺适合刚入门或者想梳理知识点的你。数据库挖掘、Web 挖掘、文本挖掘,还有音视频这些冷门点也都有提到。内容不算长,但干货够用。嗯,要是你想继续深挖,后面那几个链接就蛮实用了,像文本挖掘手册、R 语言那篇文章,我自己也收藏过几次。
数据挖掘
0
2025-06-17
数据挖掘经典算法概览
数据挖掘里的经典老朋友——决策树和K-Means,是真的经常用到,尤其是做分类和聚类的时候。像ID3和C4.5,用来搭建逻辑清晰的分类模型,还挺方便的,生成的树结构也容易看懂。
ID3 算法就比较适合小规模数据,优点是思路简单,基于信息增益挑选分裂属性。但它不支持连续变量,对大数据也不太友好。
如果你数据量稍微大点,或者属性有连续值,那C4.5就比较合适。它对 ID3 做了不少优化,比如用信息增益率避免偏向多值属性,还能自动离散化连续特征。
K-Means也常见,聚类效果还不错。适合那种你对数据没什么预设标签、就想看看它自己怎么分组的场景。像用户群、商品分类这些都用得上。
不过它对初始簇心挺敏
数据挖掘
0
2025-06-25
数据仓库与数据挖掘概览
信息技术普及后,企业运用管理信息系统处理事务与业务,积累了大量信息。为辅助管理决策,企业需要特殊工具从数据中提取知识,促进了数据环境需求和数据挖掘工具的发展。
数据挖掘
16
2024-05-23
关联规则挖掘数据挖掘技术概览
从交易数据库里挖规则,用得挺顺的一份资料,适合你想搞懂关联规则挖掘的来看看。文档里一口气讲了从一维布尔到多维多层的挖掘方式,还捎带聊了相关性,内容够全,节奏也清晰,适合边学边实操。
关联规则挖掘的套路,主要靠频繁项集和支持度置信度的组合。比如,你常见的Apriori 算法,用得多、资料多,学习起来也轻松。配合后面讲的AIGEP 算法,还能应付多维复杂场景,适合项目里玩点花样。
你要是搞WEKA的,可以顺着这份教程练起来,界面操作友好,过程还直观。想试试层级结构的,也别错过多层关联规则这块,挺适合做数据层次的。
嗯,如果你比较关心规则之间的冲突、负向关系,也有加权负关联规则挖掘这种小众内容,虽然
算法与数据结构
0
2025-06-16
数据挖掘工具大比拼概览
SAS公司的Enterprise Miner、IBM公司的Intelligent Miner、SPSS公司的Clementine、Statsoft公司的Statistica Data Miner、DB Miner公司的DBMiner、NCR公司的Teradata Warehouse Miner、Unica公司的Affinium Model、Insightful公司的Insightful Miner、Data Miner公司的RIK, EDM and DMSK、Information Discovery公司的Data Mining Suite、Angoss公司的KnowledgeSTUDIO、D
Oracle
4
2024-11-03
顶级期刊论文写作指南数据挖掘方向
写顶刊论文这事,听着高大上,其实有套路。USTC 来的 IEEE TKDE 主编 Xudong Wu,讲了不少干货,挺值得一听的。讲座主要围绕怎么写能发出去的好论文,尤其是像 TKDE 和 ICDM 这种顶尖平台。
数据挖掘的研究方向还挺多的,TKDE 主要关注数据挖掘、数据库系统、知识工程这些。如果你选题不沾边,那率直接被拒。所以选题关键,要新、有用,还能点现实问题。
写论文最重要的是论证有力。别只是讲你做了啥,更要为啥这么做好,实验数据得拿得出手,得讲得明白,最好能有点让人眼前一亮的发现。实证部分越细致,越容易打动审稿人。
引言部分别太学术套话,讲清楚你研究的问题在哪、为啥重要、你打算怎么
数据挖掘
0
2025-06-26