HBase Hive

ITwangnengjie 2020-01-02

Hbase数据管理

Hbase就是Hadoop database

Hbase是列式数据库

因此Hbase特别适合寻找按照时间排序寻找Top n的场景

Hive数据管理

基于 Hadoop 文件系统的数据仓库

Hive是建立在Hadoop上的数据仓库基础架构。它提供了一系列的工具,用来进行数据提取、转换、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据机制。可以把Hadoop下结构化数据文件映射为一张成Hive中的表,并提供类sql查询功能,除了不支持更新、索引和事务,sql其它功能都支持。可以将sql语句转换为MapReduce任务进行运行,作为sql到MapReduce的映射器。提供shell、JDBC/ODBC、Thrift、Web等接口。优点:成本低可以通过类sql语句快速实现简单的MapReduce统计。

相关推荐