鸢尾花数据集的可视化项目,作者是 ANTE DUJIC。嗯,这个项目叫 pands-project2021,主要是用来练习 Python 脚本和数据的。项目围绕着一个挺经典的练手数据集——鸢尾花(Iris)展开,数据集本身就适合用来做分类、聚类,还有算法测试。

四个特征:萼片长度萼片宽度花瓣长度花瓣宽度,每个特征都有一定的区分度。你可以直接上手,用 pandasmatplotlib 玩一玩数据,还能试试 sklearn 的分类模型,比如 LogisticRegressionKMeans 聚类,体验还挺不错。

另外,项目里对每个类别的都比较直观,适合刚开始学数据科学的朋友。你可以在可视化部分加点自己的风格,比如加个 seabornpairplot() 看一下分布关系。

资源方面,我顺手挑了几个关联资料,如果你想多练几套数据,也可以看看这些:

如果你正在学 机器学习数据,这个项目可以说是蛮合适的练手机会。记得动手操作一下,比看教程来得快。