阿里的HBase 容灾实践,属于那种一看就值得收藏的资料。穆公的这篇 PDF,内容硬核但说得明白,主要讲的是在阿里内部,HBase到底怎么用、怎么防故障、怎么搞容灾的。尤其适合你准备在大规模分布式项目里上 HBase 的时候翻一翻,坑在哪儿、套路在哪儿,写得挺全的。

容灾这块的比较实战,不是空谈——比如在 RegionServer 异常挂掉时,怎么做到自动恢复、数据不丢,讲得挺细。而且里面还穿插了不少运维策略,比如搭配Zookeeper怎么稳服务,可操作性强。

哦对了,PDF 也不长,翻起来没什么压力,几页就能扫完。配合下面这些文章看,效果会更好,尤其是《深入解析 HBase 容灾与备份策略》,是同一系列思路下的拓展阅读。

如果你正在搭建一套稳定的大数据平台,或者你就是负责HBase 集群日常维护的,这份资料不看就可惜了,推荐收藏。