数据挖掘的核心就是从一堆杂乱无章的数据里,淘出有价值的东西。嗯,挺像在信息沙漠里掘金,既要眼光也要技术。推荐几个还不错的资源,能帮你快速上手常见的算法实现,像Apriori
、决策树
这些基础款,不少代码都能直接跑。
数据挖掘的知识发现算法
资源也蛮全,比较适合刚入门或者想系统梳理下知识点的你。还有些带课件的,比如那份“知识工程”的内容,讲得也比较直白,拿来做演示或者教学都挺方便。
有趣的是,看到一个叫FAKE GAME
的自动化工具,虽说名字挺“朋克”,但看功能确实做了不少流程集成,自动化挖掘那块有些意思。不过建议你别全信,毕竟自动化也有边界。
哦对了,如果你在做 AI 项目或者想把数据做得更深入,建议看看人工智能导论那篇文章,里面的知识发现方法
写得还蛮有启发性的。
如果你平时用Python
比较多,建议关注下pandas
和scikit-learn
这俩组合,挖掘数据时响应快,调试也方便。不要忘了,多练多试才有感觉。