HortonWorks 的 HBase 企业级应用,讲得还挺透的,尤其是对一些新特性和实战场景,蛮有参考价值的。讲的是怎么用 HBase 做企业级数据存储的,比如数据量一大,怎么保证写入不卡、查询不慢。对你在做分布式系统或者搞大数据存储的同学来说,挺实用的一份资料。
HBase 的新特性得比较细,比如在大规模数据时怎么用RegionServer
优化性能,还讲了Bloom Filter
的实际作用,不只是讲原理,更多是怎么用,踩过哪些坑。
而且这套资料不仅是 PPT,还有实际的企业应用案例,结合使用环境,听着不空洞。比如你现在在用Hadoop
或Hive
,想加个HBase
模块来做低延迟查询,这里面就有类似的场景。
还有一点比较赞,讲了不少和Solr
集成的思路,像HBase
的二级索引怎么搞,用Solr
搭一层查询加速服务,这在电商或者日志场景里,挺常见的。
如果你对PowerDesigner
也感兴趣,顺手还能看看它做企业建模的那篇文章,逻辑设计做得好,后面接数据库、对接HBase
这些才顺手。
,HortonWorks-HBase 的企业级应用这个资料压缩包,内容不算长,但干货挺多。嗯,如果你正好在做大数据系统的底层设计或者打算引入HBase
,值得一看。