面向 Hadoop 1.x 环境的老版本HBase,稳定、兼容性好,适合做老系统维护或者轻量级的大数据实验。
hbase-0.98.0-hadoop1这个压缩包,算是比较经典的版本之一。和现在的 YARN 体系不同,它还是基于JobTracker
/TaskTracker
架构的,部署简单,资源调度也直观。
从架构上说,HBase挺适合做高并发随机写入的场景,比如实时日志。它走的列式存储,每次读写只拉取特定列,响应也快,空间也省。Region
拆得好,扩展性也不错。
基本概念还是那些——表、行、列族、列和timestamp
版本号,习惯了之后用起来挺顺手的。你可以像操作二维表一样存超大规模的数据,还能版本化,蛮灵活。
部署的时候记得配好HBASE_HOME
、HADOOP_HOME
这些环境变量,hbase-site.xml
里把zookeeper
地址、master
地址配清楚,省得启动报错。RegionServer内存可以适当放宽些,性能会好不少。
如果你现在还在用 Hadoop 1.x,不妨把这个版本的 HBase 捡起来用用;简单稳定,适合老系统迭代,也方便测试。Hadoop 集群搭建 HBase 集群这篇文章你可以看看,有搭建的细节。