数据挖掘导论第二版第4章集成学习方法
组合方法的几种常见玩法讲得挺清楚的,尤其是Bagging和Boosting那块,基本就是你日常调分类器绕不开的核心套路。讲步骤的时候有条理,直接告诉你咋做,咋组合,怎么提升准确率,挺实用。
Bagging的比较到位,从随机采样讲到如何组合多个模型,像Random Forest这种常见的集成方法也带着讲了,细节不啰嗦,刚刚好。
Boosting这块提到了迭代权重更新的逻辑,能帮你理解为啥弱分类器叠起来能变强。AdaBoost这类思路看完就知道怎么调权重了。
错误纠正输出编码(ECOC)蛮有意思的,适合搞多分类问题的时候上手,原理听起来复杂,其实就是转二进制编码,多个二分类器一起上阵。
如果你平时
数据挖掘
0
2025-06-17
数据挖掘导论第 1 章绪论
本幻灯片展示了数据挖掘导论第二版的第 1 章内容。
数据挖掘
10
2024-05-26
数据挖掘概念与技术(第二版)
本书专注于数据挖掘的基础概念、方法和技术,涵盖数据预处理、聚类分析、分类与回归树等关键内容。由Jiawei Han和Micheline Kamber撰写,适用于学术和实践需求。
数据挖掘
12
2024-08-22
Mining of Massive Datasets第二版数据挖掘
英文原版的《Mining of Massive Datasets》还挺适合前端开发者了解点大数据知识的。尤其是你做数据可视化、需要搞点数据预啥的,翻一翻还挺有启发。讲得比较接地气,虽然是讲大数据算法,但有不少图示和例子,像 MapReduce、PageRank 这些,讲得还算清楚,不会让人看着头疼。你要是搞前后端结合的项目,懂点底层原理,交流也更顺了。几个扩展资源也值得看看,像《大数据挖掘技术》那个 PDF,内容比较实在,另外像Overview文档也适合快速过一遍。建议你边看边记下关键点,比如MinHash、Locality Sensitive Hashing这些在推荐系统里都用得上。对了,有
数据挖掘
0
2025-06-17
Web数据挖掘第二版Bing Liu
数据挖掘领域的老朋友,Web 数据挖掘这本书的第二版,内容更新得还挺及时。Bing Liu 写的,逻辑清晰,思路也实用,适合想搞清楚爬虫、信息整合这些常见任务的你。结构化数据的抽取讲得蛮细,还带着一点实际操作的味道,不会太学术。像观点挖掘这种听着高大上但做起来接地气的技术,这本书也有,属于那种“看得懂又能用”的类型。书分两部分,前半段是数据挖掘基础,后半段就往 Web 上靠了,讲用户行为、链接这些内容,思路比较系统,看下来不会东一块西一块。如果你平时有写数据可视化或做后台的需求,这书还挺值得一翻的。有空的时候翻翻,不亏。如果你还想深入了解,比如非结构化内容怎么搞,这几篇相关文章你也可以看看。
算法与数据结构
0
2025-06-15
数据挖掘概念与技术 第二版
汉,卡伯著,Data Mining: Concepts and Techniques, 2nd Edition
数据挖掘
14
2024-05-12
数据挖掘概念与技术(第二版)答案
数据挖掘真的是个越来越火的技术了,尤其是大数据时代的今天。它不仅仅是把数据成信息那么简单,更是多个技术的融合。像是数据库、机器学习、统计学,还有神经网络,几乎每个领域都有它的影子。如果你平时有接触过数据,这些技术应该不陌生。数据预、聚类、关联规则挖掘这些方法都挺重要,能你从海量数据中提取出有用的信息。比如你在做电商推荐系统时,频繁模式和分类预测就能帮你发现用户行为的规律,从而精准推荐商品。要注意,数据清洗和数据规约这些步骤一定不要跳过,保证数据质量才能确保挖掘结果靠谱。如果你是刚入门,推荐先从基础的数据仓库和OLAP了解起来,它们可以为你的数据挖掘打下坚实的基础。其实,数据挖掘就像是一个探索未
数据挖掘
0
2025-06-11
现代计算机算法导论第二版
本书全面介绍了现代计算机算法的研究。它详细介绍了许多算法,并对它们进行了深入讨论,同时使得设计和分析对所有读者都易于理解。
Access
7
2024-07-16