数据挖掘的基础知识整理挺实用的,尤其是刚入门的时候,不容易踩坑。内容来源靠谱,来自早期的数据挖掘讨论组,去繁就简,把核心概念和背景讲得还挺清楚的。
数据挖掘的基础概念部分得比较细,像“怎么从一堆乱七八糟的数据里找出有价值的东西”这种问题,文章里就有通俗解释,适合不想看论文又想搞懂原理的你。
内容里提到的市场数据也挺有意思,比如 1999 年整个行业才 7.5 亿美元,预估几年内就涨到 22 亿,嗯,这增速谁看了不心动?而且国外专家还预测,中国也会是数据挖掘的大市场。
文末顺带还整理了几篇延伸阅读,像关联在信息提取中的玩法,或者基于随机森林的特征选择,都蛮有实战价值。点进去看看,多是能马上应用到你项目里的干货。
推荐你重点看看:
- 数据挖掘技术探析关联在信息提取中的应用
- RapidMiner 信息提取插件开源版
- 基于随机森林的宏观经济变量特征选择
如果你正准备接触数据挖掘,不妨先把这些基础概念吃透,再动手实操,效果会更好。