FP、ID3、贝叶斯三种算法的对比,算是数据挖掘里的老三样了。用同一组数据跑了一遍,结果一目了然,适合快速上手做个对比实验,看看谁更合你胃口。
ID3 的决策树思路挺清晰,适合结构化数据,逻辑直观;贝叶斯嘛,优点是计算快,还挺适合文本类的分类问题;FP 算法对频繁项集挖掘拿手,省内存不说,效率也还不错。
如果你手上正好有一组数据,想看看不同算法怎么的,推荐你看下下面几个链接。ID3相关的实现挺多的,C 语言
也有优化版,MATLAB
也有图形;贝叶斯入门资料也比较容易懂。
比如你可以看看:MATLAB 实现数据挖掘 ID3 算法详解,挺适合理解算法流程;要想搞懂优缺点和怎么优化的,可以看看ID3 算法优缺点及其应用实践;还有朴素贝叶斯算法那篇,讲得还蛮通俗的。
建议你可以把数据结构、准确率、速度几个指标做个表格比一下,直观多。如果你平时也用Python
或者MATLAB
,拿来练练手也挺合适。