hive apache - 腾讯云开发者社区

文章/答案/技术大牛

发布

Apache Hudi与Hive集成手册

之后hive表名hudicow 4.2.1 COW表实时视图查询设置hive.input.format 为org.apache.hadoop.hive.ql.io.HiveInputFormat或者org.apache.hudi.hadoop.hive.HoodieCombineHiveInputFormat...后，像普通的hive表一样查询即可 set hive.input.format= org.apache.hadoop.hive.ql.io.HiveInputFormat; select count(...hive.input.format = org.apache.hadoop.hive.ql.io.HiveInputFormat; set hoodie.hudicow.consume.mode =...hive表查询，因此在rt表增量查询完成后，应该设置set hive.input.format=org.apache.hadoop.hive.ql.io.HiveInputFormat;或者改为默认值set...hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;用于其他表的查询。

1.8K3 1

Apache Hive走向内存计算，性能提升26倍

Apache Hive 2.1新引入了6大性能，包括：（1）LLAP。...Apache Hive 2.0引入了LLAP（Live Long And Process），而2.1则对其进行了极大的优化，相比于Apache Hive 1，其性能提升约25倍；（2）更鲁邦的SQL...接下来详细介绍对Apache Hive 2.1性能提升至关重要的优化：LLAP。...Hive2 LLAP的引入，标志着Apache Hive进入内存计算时代。总结起来，内存计算类型可分为以下三类： ?.../blog/apache-hive-going-memory-computing/

1.5K5 0

您找到你想要的搜索结果了吗？

是的

没有找到

Apache Hive

Apache Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供一种HQL语言进行查询，具有扩展性好、延展性好、高容错等特点，多应用于离线数仓建设。 1....Hive架构 ? 存储：Hive底层存储依赖于hdfs，因此也支持hdfs所支持的数据存储格式，如text、json、parquet等。...当我们将一个文件映射为Hive中一张表时，只需在建表的时告诉Hive，数据中的列名、列分隔符、行分隔符等，Hive就可以自动解析数据。...用户在建表的时候可以使用Hive自带的serde或者自定义serde，Hive通过serde确定表具体列的数据。...需要设置hive.exec.rowoffset=true来启用 10.Hive条件判断 Hive中可能会遇到根据判断不同值，产生对应结果的场景，有三种实现方式：if、coalesce、case when

1.2K1 0

Apache - Hive环境部署与快速入门

Title : Apache-Hive Author: Titan 1. 什么是Hive Hive：由 Facebook 开源用于解决海量结构化日志的数据统计。...Hive的安装记录 Hive的安装相对Hadoop来说比较容易，这里使用的是hive-1.2.2版本首先：将 apache-hive-1.2.2-bin.tar.gz 上传到机器中并解压修改/opt...=/opt/hadoop-2.10.0 export HIVE_CONF_DIR=/opt/apache-hive-1.2.2-bin/conf 启动Hadoop集群，然后在 hive安装目录下的bin...目录中，运行hive二进制文件，即可启动hive。...Hive的基本操作（1）启动 hive bin/hive （2）查看数据库 hive> show databases; （3）打开默认数据库 hive> use default; （4）显示 default

7642 0

Apache Hive 是怎样做基于代价的优化的？

上一篇文章 Apache Calcite 为什么能这么流行末尾提到要单独开一篇文章，聊下 Hive 怎么利用 Calcite 做基于代价查询优化，现在兑现承诺。...但是 RBO 还不够好：规则是基于经验的，经验就可能是有偏的，总有些问题经验解决不了不太可能列出所有经验，事实上这些规则也确实是逐渐充实的 Hive 里的 CBO Hive 在 0.14 版本引入了...Hive 的数据是存在 HDFS 上的，所有对 HDFS 上的数据的读写都得经过 HDFS，而不能直接操作磁盘。...Hive 是怎么利用 Calcite 做的 CBO ? Hive 在 0.14 版本终于引入了 CBO，这个在传统关系数据库里几乎是标配的东西。早期的包结构和依赖的项目名是这样： ?...CBO 相较于 RBO，是一种更加准确和高效的优化方法 Hive 通过 Calcite 灵活的架构，很方便的实现了 CBO 需要明智的收集足够的数据分析结果来帮助 CBO Hive 的代价模型还不够完美

1.2K2 0

Apache Hive 快速入门

安装 Apache Hive 63.1.1. MySQL 63.1.2. Hadoop 63.1.3. Hive 63.1.4. 启动 Hive 63.1.5. 访问 Hive 63.2....安装 Apache Hive 安装 Apache Hive 需要 Hadoop和MySQL，这里假设你已经懂得如何安装Hadoop和MySQL，所以一下将采用Netkiller OSCM一件安装脚本来初始化.../apache/hive/stable-2/apache-hive-2.1.1-bin.tar.gz tar zxf apache-hive-2.1.1-bin.tar.gz mv apache-hive...-2.1.1-bin /srv/apache-hive-2.1.1 ln -s /srv/apache-hive-2.1.1/ /srv/apache-hive chown hadoop:hadoop...-R /srv/apache-hive-2.1.1 cat > /srv/apache-hive/conf/hive-env.sh <<'EOF' export JAVA_HOME=/srv

1.1K8 0

Apache Zeppelin 中 Hive 解释器

重要的提醒 Hive Interpreter将被弃用并合并到JDBC Interpreter中。您可以使用具有相同功能的JDBC解释器使用Hive Interpreter。...属性属性值 hive.driver org.apache.hive.jdbc.HiveDriver hive.url jdbc:hive2://localhost:10000 hive.user hiveUser...hive.password hivePassword 依赖 Artifact Exclude org.apache.hive:hive-jdbc:0.14.0 org.apache.hadoop...:hadoop-common:2.6.0 配置属性默认描述 default.driver org.apache.hive.jdbc.HiveDriver JDBC驱动程序的类路径 default.url...它可以像%hive(${prefix})。概述在Apache Hive™ 数据仓库软件便于查询和管理驻留在分布式存储大型数据集。

2.2K11 1

Return Code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask

Hive执行脚本: Return Code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask 0. 写在前面 1. 实验场景 1....=.yyyy-MM-dd # 30-day backup #log4j.appender.DRFA.MaxBackupIndex=30 log4j.appender.DRFA.layout=org.apache.log4j.PatternLayout...console # Add "console" to rootlogger above if you want to use this # log4j.appender.console=org.apache.log4j.ConsoleAppender...log4j.appender.console.target=System.err log4j.appender.console.layout=org.apache.log4j.PatternLayout...参考 https://stackoverflow.com/questions/11185528/what-is-hive-return-code-2-from-org-apache-hadoop-hive-ql-exec-mapredtask

6464 0

org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

1.3K5 0

0803-什么是Apache Ranger - 5 - Hive Plugin

在阅读本文前，建议先阅读前面的文章：《0741-什么是Apache Ranger - 1》《0742-什么是Apache Ranger - 2》《0745-什么是Apache Ranger -...3》《0800-什么是Apache Ranger - 4 - Resource vs Tag Based Policies》本文主要介绍Ranger中的Hive Plugin，当你尝试在Hive中创建或修改...比如为了将授权应用于Hive实体，如DB，Table或Columns，你必须为Hive服务安装Ranger Plugin。...参考前面的文章《什么是Apache Ranger - 4 - Resource vs Tag Based Policies》，我们知道什么是标签策略以及它是如何工作的。...这样如果Ranger服务挂了，客户端如Hive的授权依旧可以正常执行。等Ranger服务恢复，Hive插件则会恢复定期去Ranger同步策略。

1.5K1 0

Unable to instantiate org.apache.hadoop.hive.metas

hive启动后运行命令时出现： FAILED: Error in metadata: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.metastore.HiveMetaStoreClient...FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask 这种情况一般原因比较多，所以需要进行...hive调试：进入hive的bin目录输入：hive --hiveconf hive.root.logger=debug,console; 进去的原因有多种，但一般常见的有两种， 1 没有将jdbc驱动包导入到...hive的lib目录解决方案：下载mysql jdbc驱动包导入到hive的lib目录中 http://www.mysql.com/downloads/connector/j/5.1....html 2 mysql中保存hive元数据的数据库没有赋予足够权限解决方案：赋予hive数据库足够权限，方式有3中如下： 1.用root 进入mysql后 mysql>set password

87715 0

Hive2：Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

5472 0

用 Apache Doris 替换 Apache Hive、Elasticsearch 和 PostgreSQL

我们的旧数据仓库由当时最流行的组件组成，包括 Apache Hive、MySQL、Elasticsearch 和 PostgreSQL。...它们支持我们数据仓库的数据计算和数据存储层：数据计算：Apache Hive 作为计算引擎。数据存储：MySQL 为 DataBank、Tableau 和我们面向客户的应用程序提供数据。...这就是 Apache Doris 在我们的数据仓库中取代 Hive、Elasticsearch 和 PostgreSQL 角色的方式。这样的改造为我们节省了大量的开发和维护的精力。...即席查询之前：每次提出新的请求时，我们都会在Hive中开发和测试数据模型，并在 MySQL 中编写调度任务，以便我们面向客户的应用平台可以从 MySQL 中读取结果。...最后，我想与大家分享一些我们第一次与 Apache Doris 社区交谈时最感兴趣的事情： Apache Doris 支持数据摄取事务，因此可以确保数据只写入一次。

2.7K2 0

CDP中的Hive3系列之启动Apache Hive3

在不安全的集群上启动 Hive 如果您想使用 Apache Hive 进行快速测试，您可以使用 Hive 默认授权模式来执行此操作，假设您位于不安全的集群上（没有 Kerberos 或 Ranger...默认授权模式下，只有用户hive可以访问Hive。启动 Hive shell 的步骤，不要与 CDP 不支持的 Hive CLI 混淆，包括如何登录到集群。...例如： ssh myhost-vpc.cloudera.com 键入hive以从命令行启动 Hive。输入 Hive 查询。.../topics/hive_start_hive.html 使用密码启动 Hive 您可以使用 Beeline 命令启动 Hive shell，以作为 Apache Ranger 授权的最终用户查询 Hive.../topics/hive_start_hive_as_authorized_user.html 运行 Hive 命令您可以从集群中节点的命令行运行大多数将配置变量推送到 Hive SQL 脚本的 Hive

1.4K3 0

「Hudi系列」Apache Hudi入门指南 | SparkSQL+Hive+Presto集成

' STORED AS INPUTFORMAT 'org.apache.hudi.hadoop.HoodieParquetInputFormat' OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat...org.apache.hudi.hive.MultiPartKeysValueExtractor") // 设置索引类型目前有HBASE,INMEMORY,BLOOM,GLOBAL_BLOOM...://hj:10000", "--partition-value-extractor", "org.apache.hudi.hive.MultiPartKeysValueExtractor...fromCommitTime = "20200220094506" // 获取当前增量视图后几个提交批次 val maxCommits = "2" Class.forName("org.apache.hive.jdbc.HiveDriver...// 这里设置增量视图参数 stmt.execute("set hive.input.format=org.apache.hudi.hadoop.hive.HoodieCombineHiveInputFormat

2.7K2 0

Apache Hive-2.3.0 快速搭建与使用

Hive 简介 Hive 是一个基于 hadoop 的开源数据仓库工具，用于存储和处理海量结构化数据。...192.168.252.122 node3（slave2）从机: 192.168.252.123 node4（mysql）从机: 192.168.252.124 依赖环境安装Apache...5.7.19 主从复制，以及复制实现细节分析安装下载解压 su hadoop cd /home/hadoop/ wget https://mirrors.tuna.tsinghua.edu.cn/apache.../hive/hive-2.3.0/apache-hive-2.3.0-bin.tar.gz tar -zxvf apache-hive-2.3.0-bin.tar.gz mv apache-hive-2.3.0...#hive export PATH=${HIVE_HOME}/bin:$PATH export HIVE_HOME=/home/hadoop/hive-2.3.0/ 使环境变量生效，运行 source

1.6K6 0

解决Hive启动失败Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

今天在使用Hadoop集群上的Hive时，结果出现了以下的情况。...hive (default)> show databases; FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException...: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient...通过控制台的异常信息我们可以知道Hive的metadata服务未开启导致的。...解决方案: 进入到Hive的bin目录下,键入命令: ./hive --service metastore & ?

20.8K4 0

Apache-Hive 使用MySQL存储Hive的元数据

默认情况下，Hive的元数据是存储到Derby中的，这是Apache的一个纯Java编写的小巧数据库，类似于Sqlite。...但是这样就会出现一个情况：Derby是单例的，当你在一个终端打开了hive时，在另外一个终端打开hive命令行会报错。所以使用MySQL来存储元数据能够解决这个问题，并且也更方便迁移和备份。...dev.mysql.com/downloads/connector/j/ 下载Mysql-Connector 解压后获得mysql-connector-java-8.0.21.jar，将jar包移动至 /opt/apache-hive...-1.2.2-bin/lib 下配置Hive中MySQL的连接第一步，在Hive的conf目录中新建文件hive-site.xml 第二步，配置如下信息 hive的时候Cli无响应：这个问题查阅了很多资料并没有找到更加详细的信息，但是经过DEBUG初步判断还是MySQL数据库的问题，导致Hive第一次启动时无法正常完成Metastore

3K3 0

Spring boot with Apache Hive

Spring boot with Apache Hive 5.26.1....-- https://mvnrepository.com/artifact/org.apache.hive/hive-jdbc --> org.apache.hive...hive.driver-class-name: org.apache.hive.jdbc.HiveDriver hive.username=hive hive.password=hive 如果使用...: org.apache.hive.jdbc.HiveDriver type: com.alibaba.druid.pool.DruidDataSource username: hive...hive 官方是推荐使用beeline，因为它还提供了更为友好的交互方式（类似mysql client）连接远程主机 [hadoop@localhost ~]$ /srv/apache-hive/

2.2K5 0

Apache Hive 3架构概述

了解Apache Hive 3的主要设计功能（例如默认的ACID事务处理）可以帮助您使用Hive来满足企业数据仓库系统不断增长的需求。 ?...Apache Tez Apache Tez是Hive on Tez服务的Hive执行引擎，该服务包括Cloudera Manager中的HiveServer（HS2）。Tez不支持MapReduce。...Hive 3通过以下方式针对对象存储（例如S3）进行了优化： Hive使用ACID来确定要读取的文件，而不是依赖于存储系统。在Hive 3中，文件移动比在Hive 2中减少。...Apache Hive Metastore共享 Hive、Impala和其他组件可以共享远程的Hive元存储。在CDP公共云中，HMS使用预安装的MySQL数据库。...原文链接：https://docs.cloudera.com/cdp-private-cloud/latest/upgrade/topics/hive-apache-hive-3-architectural-overview.html

1.7K1 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云