面向 Hadoop 1.x 环境的老版本HBase,稳定、兼容性好,适合做老系统维护或者轻量级的大数据实验。

hbase-0.98.0-hadoop1这个压缩包,算是比较经典的版本之一。和现在的 YARN 体系不同,它还是基于JobTracker/TaskTracker架构的,部署简单,资源调度也直观。

从架构上说,HBase挺适合做高并发随机写入的场景,比如实时日志。它走的列式存储,每次读写只拉取特定列,响应也快,空间也省。Region拆得好,扩展性也不错。

基本概念还是那些——列族timestamp版本号,习惯了之后用起来挺顺手的。你可以像操作二维表一样存超大规模的数据,还能版本化,蛮灵活。

部署的时候记得配好HBASE_HOMEHADOOP_HOME这些环境变量,hbase-site.xml里把zookeeper地址、master地址配清楚,省得启动报错。RegionServer内存可以适当放宽些,性能会好不少。

如果你现在还在用 Hadoop 1.x,不妨把这个版本的 HBase 捡起来用用;简单稳定,适合老系统迭代,也方便测试。Hadoop 集群搭建 HBase 集群这篇文章你可以看看,有搭建的细节。