分布式键值存储里的老大哥,Apache Accumulo的accumulo-1.10.2-bin.tar.gz
是那种你一旦熟了就会觉得蛮顺手的家伙。底层靠的是Hadoop、Zookeeper和Thrift,所以你要是这些玩得溜,上手会比较快。挺适合搞大数据权限控制或者需要粒度较细的数据隔离的场景。
单元级访问控制和服务端变更机制是它比较出彩的点,比如你想在服务端一些数据清洗、审计之类的需求,它就比一般的 K/V 存储要灵活不少。哦对,它还是跟BigTable一个思路的,所以了解过 Google 那套设计思路的会更容易理解它的架构。
你要是准备整一套大数据平台,像Hadoop + Zookeeper + Accumulo这么一套组合拳,搭配HBase或者Spark一起用也蛮合适的。部署上没太大门槛,文档也还算靠谱,网上教程也多。比如下面这些链接就挺实用:
如果你项目里对数据隔离要求比较高,又想自己写点服务端逻辑来控制写入逻辑,那用用看Accumulo会是个不错的选择,配合熟悉的 Hadoop 生态工具,开发起来也不难。
资源地址是accumulo-1.10.2-bin.tar.gz
,下载包直接能跑,适合搞个测试环境先摸一摸。你要真整生产,也不用太担心性能,社区踩过的坑现在基本都填了。