Apache HBase 2.0.0 的第二个 Beta 版已发布,Apache HBase 2.0.0-beta-2 是 2.0 版本的非生产预览版,包含之前 alpha 版本中的所有新特性 (new assignment manager, offheap read/write path, in-memory compactions 等),可点此查看 2.0 的完整新特性。
官方原计划是在 2 月底发布第一个 2.0.0 候选版之前,发布一个测试版 2.0.0-beta-2。目前 Beta 版推迟到现在发布,所以 RC 版亦将推迟发布。
目前一个已知的问题是 User API 未被正确过滤,因此它显示的不仅仅是 InterfaceAudience 的公共内容(HBASE-19663,待修复)。
HBase - Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。
HBase是Google Bigtable的开源实现,类似Google Bigtable利用GFS作为其文件存储系统,HBase利用Hadoop HDFS作为其文件存储系统;Google运行MapReduce来处理Bigtable中的海量数据,HBase同样利用Hadoop MapReduce来处理HBase中的海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。
此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得传统数据库数据向HBase中迁移变的非常方便。
来自:开源中国社区