SQL2005 的数据库管理规则,配上聚类算法的详细,用起来还挺顺的。杨大川的这个资源讲得比较清楚,尤其是那些基础算法,比如 K-Means、DBSCAN,都有举例,代码也不难理解,逻辑挺清晰的。
聚类的部分还蛮值得一看,适合刚入门或者在项目里想快速上手的人。嗯,像用 SQL 查用户行为数据、做标签分类啥的,用这些算法一下,思路就开了。
建议你在看之前,准备好个 SQL 环境,比如SQL Server Management Studio
,这样边看边试效果更好。资源里对数据预
也提到了几句,比如怎么缺失值、怎么筛选字段,用起来还挺实用的。
如果你对聚类更感兴趣,可以看看相关文章,一个是关于整体聚类思路的,一个是专讲算法实现的。嗯,都在下面帮你贴上链接了。