基于 K-means 的电网用户标签分类思路还挺有意思的,尤其是在做特征挖掘的时候。这套方法用聚类把用户数据先粗分一波,再用加权策略对标签精修,检测逻辑还挺巧妙,尤其适合做大数据量下的分布式。如果你也碰到特征识别误差大的问题,这招可以试试,效果比传统方式要稳。