IRIS 数据集的分类示例,用的是WEKA
工具,操作简单、界面友好,蛮适合刚入门机器学习的同学。数据清洗啥的不用太多操作,点点按钮就能跑结果,挺适合做课堂演示或者小项目练手的。
用J48
决策树或者NaiveBayes
模型跑一遍,准确率还不错,分类结果可视化也方便。你可以换着算法试试,像RandomForest
这种集成模型,用起来也没门槛,拖一下就能上。
如果你还不太熟WEKA
,建议看看这几个教程:WEKA 分类模型评估教程、WEKA 数据挖掘:分类与回归详解,都有中文,图文还挺详细。
顺带提一句,Iris
数据本身结构清晰,特征不多但区分度挺好,适合用来测试各种分类器。你甚至可以拿去和BP 神经网络
、SVM
做个对比看看效果差异。
如果你想再挖深点,也可以研究下这个IRIS 聚类示例,分类完了做点无监督学习,也蛮有意思的。