Hive

Hive是Hadoop生态系统中比不可少的一个工具,它提供了一种SQL(结构化查询语言)方言,可以查询存储在Hadoop分布式文件系统(HDFS)中的数据或其他和Hadoop集成的文件系统,如MapR-FS、Amazon的S3和像HBase(Hadoop数据仓库)和Cassandra这样的数据库中的数据。

大多数数据仓库应用程序都是使用关系数据库进行实现的,并使用SQL作为查询语言。Hive降低了将这些应用程序转移到Hadoop系统上的难度。凡是会使用SQL语言的开发人员都可以很轻松的学习并使用Hive。如果没有Hive,那么这些用户就必须学习新的语言和工具,然后才能应用到生产环境中。另外,相比其他工具,Hive更便于开发人员将基于SQL的应用程序转移到Hadoop中 。如果没有Hive,那么开发者将面临一个艰巨的挑战,如何将他们的SQL应用程序移植到Hadoop上。

Hive不是一个完整的数据库。Hadoop以及HDFS的设计本身约束和局限性地限制了Hive所能胜任的工作。其中最大的限制就是Hive不支持记录级别的更新、插入或者删除操作。但是用户可以通过查询生成新表或者将查询结果导入到文件中。同时,因为Hadoop是面向批处理的系统,而MapReduce任务(job)的启动过程需要消耗较长的时间,所以Hive查询延时比较严重。传统数据库中在秒级别可以完成的查询,在Hive中,即使数据集相对较小,往往也需要执行更长的时间。

引自Hive编程指南

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 大型网站技术架构,网站的高性能架构(二)

    网站的性能指标,既可以是开发人员客观的性能分析数据,测试指标。也可以是主观的终端用户体验感受。一般而言,我们用如下指一些标来衡定一个网站的性能水平:响应时间、并...

    用户5997198
  • LNMP相关软件安装

    PHPMyAdmin目录 : 0.9版本为/home/wwwroot/phpmyadmin/ 1.0及以后版本为 /home/wwwroot/default/p...

    公众号php_pachong
  • zabbix4.2安装教程

    博客多以学习笔记形式记录,所谓笔记,就是不断学习并改进,系列文章不定期更新 勇敢面对你所畏惧的,避免那一天你不得不面对 时常问自己有多少知识是一般网上找不到...

    拓荒者
  • 项目中常常出现的问题,答案在这里!

    >如果是技术问题,接下去第二问,这个问题能解决吗?是否需要大牛一起来看一下。如果回答需要帮助,直接找技术一起看。

    公众号php_pachong
  • 关于数据库事务

    转账是最经典也常被拿出来说的例子。假如小明要给小红转账1000元,这个操作会涉及到两个关键:将小明的余额减少1000元,将小红的余额增加1000元。但万一在这两...

    happyJared
  • ThinkPHP数据库 - 数据表模型和基础模型

    要测试数据库是否正常连接,最直接的办法就是在当前控制器中实例化数据表,然后使用 dump 函数输出,查看数据库的链接状态。代码:

    公众号php_pachong
  • 厉害了!竟然有程序员在GitHub上建了一个新华词典数据库

    文章整理自:https://github.com/pwxcoo/chinese-xinhua

    用户5997198
  • 入坑!通过ajaxreturn jquery json提交form

    \Think\Controller类提供了ajaxReturn方法用于AJAX返回数据给客户端(视图、模板、js等)。并且支持JSON、JSONP、XML和EV...

    公众号php_pachong
  • 【必知】大型网站技术架构,初入探秘(一)

    一个好的网站架构需要具备以下几个特点:高可用、高性能、易扩展、可伸缩且安全。同时网站的访问特点符合二八定律,即:80%的业务访问集中在20%的数据上。网站的技术...

    用户5997198
  • 大型网站技术架构,网站的高可用架构(三)

    我们通常使用多少个9来衡量网站的可用性,比如4个9代表一个服务99.99%可用,即该需要保证在单位时间内只有0.01%的时间可以发生故障服务不可用。2个9与3个...

    用户5997198

扫码关注云+社区

领取腾讯云代金券