Apriori 算法的入门材料里,chap06 关联-基本概念和算法 95.pdf
算是蛮经典的一份。教材是陈封能等人翻译的老版本,虽然时间久了点,但讲得还挺系统,尤其适合刚接触关联规则挖掘的同学。
教材里的Apriori 算法部分,逻辑清晰,例子比较接地气,比如超市购物篮那块,讲怎么找出“买了牛奶也会买面包”这种模式,挺好懂的。支持度
、置信度
这些概念也都解释得还行,不会太抽象。
要说实用,那还得看搭配的资源链接。有个讲剪枝的文章(Apriori 高效剪枝关联规则挖掘算法),讲怎么加快挖掘过程,比较适合你做项目时优化效率用。还有一篇讲FP-Growth
的(关联规则算法比较 FP-Growth 与 Apriori),适合拿来和 Apriori 对比着看。
网页里的文章多半是 PDF 或下载页,打开速度一般,但内容还行,建议用电脑下下来慢慢看。如果你是第一次碰数据挖掘类的任务,建议先搞清楚几个基本参数,尤其是最小支持度
的设置,别一上来就设太低,数据太多会跑到天荒地老。
哦对,还有篇专门讲Apriori 挖掘疾病症状
的(Apriori 算法挖掘疾病症状关联规则),医疗方向的可以参考参考。
如果你正好在做电商推荐、用户行为,或者玩玩看数据里的隐藏规律,这套资料真的还不错,至少让你打下个不错的基础。