K 最近邻算法的 Python 实现,适合刚入门机器学习或者想用点轻巧方法搞分类的你。

基于相似性原理的 KNN,思路直——你要判断一个新样本属于哪个类别?那就看看它周围都是什么,哪个多就选哪个,像不像小时候分组一样,挨着谁就算一组。

这里用 Python 写得比较清楚,逻辑也简洁,不依赖太多花里胡哨的库。欧几里得距离是默认选项,不过你要是玩别的距离函数也没啥问题,代码开得蛮灵活的。

非参数模型的优点是啥?懒得猜数据长啥样也能跑得还行,现实中用起来挺方便,尤其是你对数据分布没头绪的时候。

适合做个小项目练练手,比如图像分类、小型入侵检测系统。你要是想深入,也可以对比下它跟SVM决策树这些传统模型的表现,提升挺快。

哦对了,如果你对半监督学习图结构算法也感兴趣,可以顺手看看下面几个资源,跟 KNN 有不少可以搭配玩的点。