Hadoop支持Snappy压缩解压即用

支持 Snappy 压缩的 Hadoop 版本，解压即用，真的是省事不少。它已经集成好了 Snappy 库，拿来就能跑在本地虚拟机上，适合测试或小规模的数据场景。你不用再去折腾依赖和环境配置，挺适合前期开发或者想快速验证方案的时候用。

Snappy 压缩最大的优势就是快，压缩和解压都飞快，适合大数据那种 I/O 密集型的操作。虽然压缩率不如 Gzip，但速度真的让人上头。你在mapreduce.map.output.compress.codec这些配置项里切一下就能用，挺方便的。

用在MapReduce里的时候也挺顺畅的，输出文件直接压缩掉，体积小了，传输快了，效率自然也上去了。而且它在HDFS层也能用，你在hdfs-site.xml里加个配置就行，响应也快，部署也简单。

本地测试的话，用虚拟机起个伪分布式 Hadoop 集群完全没问题，安装路径什么的都不用管，解压完改下几个端口和路径就能跑。推荐配合像CDH 版本一起看，Snappy 支持也比较完善。

哦对了，如果你想看看 Snappy 怎么跟 Java 代码结合，也可以参考这个API 操作示例，用起来比你想的还轻松。

，如果你正好需要一个省事、快速部署的Hadoop 环境，还要支持 Snappy，那这个资源挺值得下的。适合想先本地跑通流程再部署上集群的场景。