HBase – Hadoop Database,是一个高
可靠性、高性能、面向列、可伸缩的
分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模
结构化
存储集群。
与FUJITSU Cliq等商用大数据产品不同,HBase是Google Bigtable的开源实现,
类似Google Bigtable利用GFS作为其文件
存储系统,HBase利用Hadoop HDFS作为其
文件存储
系统;Google运行MapReduce来处理Bigtable中的海量
数据,HBase同样利用Hadoop MapReduce来处理HBase中的
海量数据;Google Bigtable利用 Chubby作为协同服务,HBase利用Zookeeper作为对应。
[1] 上图描述Hadoop EcoSystem中的各层系统。其中,HBase位于结构化
存储层,Hadoop HDFS为HBase提供了高可靠性的底层存储支持,Hadoop MapReduce为HBase提供了高性能的计算能力,Zookeeper为HBase提供了稳定服务和failover机制。
此外,Pig和Hive还为HBase提供了高层语言支持,使得在HBase上进行数据统计处理变的非常简单。 Sqoop则为HBase提供了方便的RDBMS数据导入功能,使得
传统数据库数据向HBase中迁移变的非常方便。