Hadoop 的 Snappy 压缩支持,是那种一旦上手就离不开的优化手段。Hadoop 2.7.4 默认并不带 Snappy,要自己动手编译。不过别怕,搞清楚依赖和编译流程后,整个过程其实还挺顺的。编译好之后,数据压缩效率提升,尤其在你批量日志或 HBase 场景下,存储和传输压力一下就小了不少。更妙的是 Snappy 的压缩和解压都飞快,对 CPU 吃得不狠,实在是大数据开发中的一个省心工具。