高维数据的不均匀密度问题,挺头疼的对吧?尤其在电商网站这种页面结构千变万化的场景里,传统的聚类方法往往吃不准。你要是真遇到这类问题,可以看看这个案例。用了因子先做了降维,去掉噪声,搭配DBSCAN搞定聚类,稀疏密集混杂的数据挺顺。DBSCAN本身就挺适合不规则的数据簇,再配合参数微调,效果还不错。整体方法比较实用,适合用户行为、竞品对比这类任务。如果你最近在做电商相关的数据,不妨拿来参考下。