设计目的:让有SQL技能,但无hadoop知识的人来查询分析大数据。 1. 基于hadoop的数据仓库工具, 2. Hive中的一张表对应的是HDFS的一个目录。 3. 支持一种与SQL几乎完全相同的语言HiveQL,除了不支持更新,索引和事务控制。 4. SQL到MapReduce的映射器。 5. 提供shell,JDBC/ODBC,Thrift,web接口
hive的数据存储概念
Table(External Table也就是非hive目录下的Table),Partition,Bucket。
喜欢 (0)or分享 (0)