朴素贝叶斯分类算法挺经典的,在数据挖掘中用得也蛮多的。这份资源展示了如何对weather
数据集应用朴素贝叶斯算法,预测样本X={rainy,hot,normal,weak,?}
的play ball
类标号属性。通过求解样本在play=‘yes’
和play=‘no’
的概率,最终预测出更率的类。你看,这种方式挺适合类似天气、体育类数据的分类问题。推荐给正在学习数据挖掘或者需要用朴素贝叶斯算法做分类的同学。
如果你对Matlab
感兴趣,还可以参考这份代码资源:朴素贝叶斯 Matlab 代码的资源下载,对于实战中的算法实现比较有。
有点注意的是,数据集大小和特征选择的合理性,会影响最终的分类效果。如果你正好有类似的预测问题,不妨用这份资料试试。