HBase官方指南数据模型解析

HBase 的数据模型挺有意思的，设计得比较灵活，能大规模数据而不掉链子。你看，它的表是由行组成的，每行通过一个行键来唯一标识，行键的选取关键，能直接影响性能。像做网站时，可以用域名倒序做行键，这样相关数据就会顺利地存到一起，查询起来更快。
就是列簇，它相当于数据表中的一组列，可以自己定义是否缓存、是否压缩等。每个表的行都有一样的列簇配置，尽管某些列簇在某行里是空的，HBase 还是会保留这个空列簇。
再说说列限定符，这是用来区分同一列簇下不同列的方式，拿一个内容表举个例子，html和pdf可以是同一个列簇下的不同列限定符，表示内容的格式。
最重要的就是时间戳，它能管理数据的历史版本，每次数据写入时都会加个时间戳，读取的时候可以根据时间范围来获取不同的版本数据。
，HBase 的设计能让你海量数据的时候，既高效又灵活。不过要注意，设计一个合适的行键、合理的列簇和版本管理是高效使用 HBase 的关键。
如果你想深入了解，建议看看相关资料，对 HBase 的操作和性能优化能有更多体会。