想做数据清洗?其实有些工具和资源可以你事半功倍。MapReduce是一个挺不错的技术,能你大规模的数据清洗任务。如果你还没有找到合适的工具,不妨试试这些资源哦。比如,数据清洗开源项目就了多开源代码,能让你更高效地数据。Kettle也是一个常见的工具,适合做批量数据清洗,Kettle 数据清洗教程能帮你快速上手。如果你追求简便,还可以试试OpenRefine,它是一个完全免费的数据清洗工具,操作简单,功能也蛮强大的。,清洗数据并不是复杂,挑对工具,效率就上去了!