数据质量的老朋友 DataCleaner,用过的都说好。它不是那种花哨复杂的工具,图形界面清清爽爽,操作起来挺直观。拿来跑数据比较、验证,甚至做数据监控都不在话下,尤其适合做 Excel 或数据库清洗那类活儿。

DataCleaner的图形界面比较省事,点几下就能搞定字段、重复数据检测之类的操作,响应也快。你如果常和一堆表格打交道,这玩意儿挺省时间的,是做初步清洗的时候。

除了基本的字段,DataCleaner还能对不同数据源做比对——比如 Excel、CSV 和数据库里的数据对得挺好。也能做规则校验,比如设个条件,数据不合规就提示错误。

要做数据监控?它还有一个Web 监控界面,可以配置周期任务。你设定规则后,它能定期检查数据质量,挺适合做数据运维的朋友。

顺手推荐几个你用得上的资源,比如Scheffe 法多重比较这篇,做 Excel 时用得上;还有工程数据的技巧也挺实用。

如果你平时用Python数据,可以顺带看看Python 数据入门,思路和 DataCleaner 蛮互补的,脚本和图形操作结合用,效率高多了。

哦对了,如果你数据源更新频繁,可以先用DataCleaner跑一遍基础清洗,再用Python做二次,效果还不错。