统计 HDFS 空间占用的大数据作业脚本,挺适合日常运维排查用的。支持自定义目录和 TopN 数,一键就能筛出那些吃空间的大户。脚本逻辑也不复杂,响应也快,拿来就能用。你如果经常遇到 HDFS 快满,真可以试试这个。