linux中hive启动命令行_linux 启动hive_linux中hive启动命令 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

linux退出hive命令

在使用Hive进行数据查询和操作时，有时候我们需要退出Hive命令行界面。本文将介绍如何在Linux系统中退出Hive命令行。

01

大数据入门基础系列之浅谈Hive的用户接口

09

您找到你想要的搜索结果了吗？

是的

没有找到

关于Hive命令的7个小技巧，你都清楚吗？

最近在看冰河大佬写的《海量数据处理与大数据技术实战》，该书涵盖以Hadoop为主的多款大数据技术框架实战的内容，兼顾理论与实操，是市面上难得的技术好书。本篇文章，我就分享一下从中学习到的关于Hive命令的7个小技巧，受益的朋友记得来发三连⭐支持一下哟~

01

安装和配置Hive

直接通过MapReduce来对存储在Hadoop HDFS上的数据进行查询和分析比较繁琐而且还需要编程。Hive是一个数据仓库系统，构建在HDFS之上，它提供了类似SQL的语法（HQL），可以将HQL翻译成MapReduce作业进行查询，使得对数据的管理和检索更为便利。

03

Hive-数据仓库

交互方式-用户接口：CLI（linux命令行）、WUI（hive web页面）、Client（连接远程服务HiveServer2，eg：JDBC、ODBC）

03

linux 查看hive进程

在Linux系统中，Hive是一个基于Hadoop的数据仓库解决方案，用于查询和分析大规模数据集。在运行Hive时，有时我们需要查看Hive相关的进程信息，以便监控和管理。本篇文章将介绍如何在Linux系统中查看Hive进程的方法。

01

免密码从windows复制文件到linux

有时候，我们需要使用编码的方式将文件从Windows系统发送到Linux系统上，这篇文章将记录如何实现这一过程。

01

CDP中的Hive3系列之启动Apache Hive3

如果您想使用 Apache Hive 进行快速测试，您可以使用 Hive 默认授权模式来执行此操作，假设您位于不安全的集群上（没有 Kerberos 或 Ranger 策略）。默认授权模式下，只有用户hive可以访问Hive。启动 Hive shell 的步骤，不要与 CDP 不支持的 Hive CLI 混淆，包括如何登录到集群。

03

常见的3种Hive参数配置方法

Hive提供三种可以改变环境变量的方法，分别是：（1）、修改${HIVE_HOME}/conf/hive-site.xml配置文件；（2）、命令行参数；（3）、在已经进入cli时进行参数声明。下面分别来介绍这几种设定。

Ubuntu单机安装配置Hadoop

因为是课程要求，所以在自己电脑上安装了Hadoop，由于没有使用虚拟机，所以使用单机模拟Hadoop的使用，可以上传文件，下载文件。

02

超实用干货！Hive 函数 + Shell编程的具体实践与运用

含义：connect to Hive Server on port number -hiveconf x=y Use this to set hive/hadoop configuration variables.

01

Hive常见的属性配置

默认配置文件：hive-default.xml 用户自定义配置文件：hive-site.xml

04

大数据技术学习路线

一、大数据技术基础 1、linux操作基础 linux系统简介与安装 linux常用命令–文件操作 linux常用命令–用户管理与权限 linux常用命令–系统管理 linux常用命令–免密登陆配置与网络管理 linux上常用软件安装 linux本地yum源配置及yum软件安装 linux防火墙配置 linux高级文本处理命令cut、sed、awk linux定时任务crontab 2、shell编程 shell编程–基本语法 shell编程–流程控制 shell编程–函数 shell编程–综合案例–自

02

shell 脚本执行带参数的hivesql

原文连接：https://issues.apache.org/jira/browse/HIVE-2020

02

配置Hive使用MySql存储元数据

默认情况下，Hive会使用Derby来存储元数据（主要是表、列、分区Partition的信息）。Derby是一个嵌入式的本地数据库，只能单进程进行访问，不允许多个连接。因此，Derby只适合本地测试，不适合用在生产环境。Hive支持使用单独的数据库来存储元数据，比如MySql、PostgreSql等，本文将介绍如何配置Hive使用MySql存储元数据。

05

Presto 安装与部署

Presto 在访问 Hive 中的数据时需要得到 Hive 中的所有元数据信息，因此需要部署一个 HiveMetaStore 服务提供 Hive 的元数据信息。

02

Hive快速入门系列(7) | Hive常见的属性配置

1. Default数据仓库的最原始位置是在hdfs上的：/user/hive/warehouse路径下。

01

快速学习-Presto安装部署

支持以下文件类型：Text, SequenceFile, RCFile, ORC 此外，需要有远程的Hive元数据。不支持本地或嵌入模式。 Presto不使用MapReduce，只需要HDFS。

02

基于 OGG 的 Oracle 与 Hadoop 集群准实时同步介绍

本文阐述了从Oracle实时同步到Hadoop集群的架构实践，分析了如何实现高效、稳定、易维护的同步方案。通过在两个集群上部署OGG，利用Oracle GoldenGate技术实现数据的实时同步，并阐述了如何通过业务逻辑编排实现多个集群之间的数据同步。同时，本文还提供了同步后的数据治理方案，以保障数据的一致性和可用性。

05

2018-12-09 基于 OGG 的 Oracle 与 Hadoop 集群准实时同步介绍

https://cloud.tencent.com/developer/article/1004462

02

2021年大数据Spark（三十三）：SparkSQL分布式SQL引擎

SparkSQL模块从Hive框架衍生发展而来，所以Hive提供的所有功能（数据分析交互式方式）都支持，文档：http://spark.apache.org/docs/2.4.5/sql-distributed-sql-engine.html。

01

在shell中使用hiveSQL的注意事项

hive是数据分析人员常用的工具之一。实际工作中，使用hive基本都是在linux shell环境下。运行hiveSQL的方式有以下几种。

03

Apache Hive 3架构概述

了解Apache Hive 3的主要设计功能（例如默认的ACID事务处理）可以帮助您使用Hive来满足企业数据仓库系统不断增长的需求。

01

[981]Hive基本使用——命令行

Hive 用户接口主要有三个：命令行(CLI)，客户端(Client) 和 Web界面(WUI)。其中最常用的是 CLI，启动的时候，会同时启动一个 Hive 服务。Client 是 Hive 的客户端，用户连接至 Hive Server。在启动 Client 模式的时候，需要指出 Hive Server 所在节点，并且在该节点启动 Hive Server。 WUI 是通过浏览器访问 Hive的Web工具

03

搭建Hadoop集群(二)

rpm --import https://repo.mysql.com/RPM-GPG-KEY-mysql-2022

02

Sqoop简介以及安装

Sqoop简介以及安装近期用到Sqoop进行数据导出导入，发现网上很多的博客都不够精细，所以本人就针对Sqoop1.4.7的官方文档进行了学习，以下是学习笔记。一、介绍 sqoop是沟通HDFS和关系型数据库的桥梁，可以从HDFS导出数据到关系型数据库，也可以从关系型数据库导入数据到HDFS。当然也支持Hive、HBase跟关系型数据库之间的互相导出导入。这是一个可以进行双向转化数据的工具。二、安装 1、下载 Sqoop是Apache提供的工具，下载的时候一定要先确定hadoop的

02

2019精炼的大数据技术学习路线

近年来大数据BigData、人工智能AI、物联网Iot等行业发展迅猛，很多人都想要从事大数据技术开发工作，但是，请问要怎么做，路线是什么？从哪里开始学？学哪些？这是一个大问题。对于我自己来说，最近也在学一些大数据开发相关的技术，所以之前整理了一份《大数据技术学习路线》，希望对你有所帮助。

03

0911-7.1.7-如何在CDP集群使用Flink SQL Client并与Hive集成

在前面Fayson介绍了《0876-7.1.7-如何在CDP中部署Flink1.14》，同时Flink也提供了SQL Client的能力，可以通过一种简单的方式来编写、调试和提交程序到Flink集群，而无需编写一行Java或Scala代码。本篇文章主要介绍如何在CDP集群中使用Flink SQL Client与Hive集成。Flink与Hive的集成，主要有如下两个目的：

01

大数据入门与实战-Hive

Hive是一个数据仓库基础工具在Hadoop中用来处理结构化数据。它架构在Hadoop之上，总归为大数据，并使得查询和分析方便。最初，Hive是由Facebook开发，后来由Apache软件基金会开发，并作为进一步将它作为名义下Apache Hive为一个开源项目。它用在好多不同的公司。例如，亚马逊使用它在 Amazon Elastic MapReduce。

01

如何使用R连接Hive与Impala

继之前的文章讲述如何在Redhat中配置R环境和如何在Redhat中安装R的包及搭建R的私有源后，那我们如何使用R连接CDH集群中的Hive和Impala进行数据分析呢？本文档主要讲述如何使用R连接Hive和Impala，并分别通过命令行和CDSW进行演示。

06

【技术创作101训练营】数据仓库应用分享

嗨，大家好。我是薄荷加点糖，我是一名java后端开发，一名彻头彻尾的coder。我今天的分享主要想解决的问题是 (下一张PPT)

07

通过hiveserver远程服务构建hive web查询分析工具

（1）hive 三种启动方式及用途，本文主要关注通过hiveserver（可jdbc连接）的方式启动 1， hive 命令行模式，直接输入/hive/bin/hive的执行程序，或者输入 hive --service cli 用于linux平台命令行查询，查询语句基本跟mysql查询语句类似 2， hive web界面的启动方式，hive --service hwi 用于通过浏览器来访问hive，提供基本的基于web的hive查询服务，可以看作是hiv

05

SQL DDL：基本操作

Hive DDL根据操作对象的不同可分为：数据库操作、表的基本操作、表的高级操作、函数操作。

01

Presto实战

Presto是一个开源的分布式SQL查询引擎，适用于交互式分析查询，数据量支持GB到PB字节。

02

Hadoop学习笔记—17.Hive框架学习

Hive 是建立在 Hadoop 基础上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言，称为 QL ，它允许熟悉 SQL 的用户查询数据。同时，这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。

02

使用.net通过odbc访问Hive

在写入数据到Hive表(命令行) 这篇文章中，我们通过命令行的方式和hive进行了交互。但在通常情况下，是通过编程的方式来操作Hive，Hive提供了JDBC和ODBC接口，因为公司的数据处理程序是使用.net开发并运行在windows server上的，因此这篇文章将介绍如何通过ODBC来访问Hive。

04

Hive源码系列（四）hive2.1.1源码包介绍及调试

这次主要对hive源码包及hive的两种调试方式做了介绍，这篇结束后，整个源码调试环境的搭建已经完成。

04

Hive 整体介绍

Hive可以管理HDFS中的数据，可以通过SQL语句可以实现与MapReduce类似的同能，因为Hive底层的实现就是通过调度MapReduce来实现的，只是进行了包装，对用户不可见。 Hive对HDFS的支持只是在HDFS中创建了几层目录，正真的数据存在在MySql中，MYSQL中保存了Hive的表定义，用户不必关系MySQL中的定义，该层对用户不可见。Hive中的库在HDFS中对应一层目录，表在HDFS中亦对应一层目录，如果在对应的表目录下放置与表定义相匹配的数据，即可通过Hive实现对数据的可视化及查询等功能综上所述，Hive实现了对HDFS的管理，通过MySQL实现了对HDFS数据的维度管理 Hive基本功能及概念 database table 外部表，内部表，分区表 Hive安装 1. MySql的安装（密码修改，远程用户登陆权限修改） 2. Hive安装获取，修改配置文件(HADOOP_HOME的修改，MySQL的修改) 3. 启动HDFS和YARN(MapReduce)，启动Hive Hive基本语法： 1. 创建库：create database dbname 2. 创建表：create table tbname Hive操作： 1. Hive 命令行交互式 2. 运行HiveServer2服务，客户端 beeline 访问交互式运行 3. Beeline 脚本化运行 3.1 直接在命令行模式下输入脚本命令执行(比较繁琐，容易出错，不好归档) 3.2 单独保存SQL 命令到文件，如etl.sql ，然后通过Beeline命令执行脚本数据导入： 1. 本地数据导入到 Hive表 load data local inpath "" into table .. 2. HDFS导入数据到 Hive表 load data inpath "" into table .. 3. 直接在Hive表目录创建数据 Hive表类型： 1. 内部表: create table 表数据在表目录下，对表的删除会导致表目录下的数据丢失，需要定义表数据的分隔符。 2. 外部表: create external table 表目录下挂载表数据，表数据存储在其他HDFS目录上，需要定义表数据的分隔符。 3. 分区表：与创建内部表相同，需要定义分区字段及表数据的分隔符。在导入数据时需要分区字段，然后会在表目录下会按照分区字段自动生成分区表，同样也是按照目录来管理，每个分区都是单独目录，目录下挂载数据文件。 4. CTAS建表 HQL 1. 单行操作：array，contain等 2. 聚合操作：(max,count,sum)等 3. 内连接，外连接（左外，右外，全外） 4. 分组聚合 groupby 5. 查询 : 基本查询，条件查询，关联查询 6. 子查询：当前数据源来源于另个数据执行的结果，即当前 table 为临时数据结果 7. 内置函数: 转换, 字符串, 函数转换：字符与整形，字符与时间，字符串：切割，合并，函数：contain，max/min，sum， 8. 复合类型 map（key，value）指定字符分隔符与KV分隔符 array（value）指定字符分隔符 struct(name,value) 指定字符分割与nv分隔符 9. 窗口分析函数 10. Hive对Json的支持

01

Hive0.13.1介绍及安装部署

hive由Facebook开源用于解决海量结构化日志的数据统计。hive是基于Hadoop的一个数据仓库工具，是基于Hadoop之上的，文件是存储在HDFS上的，底层运行的是MR程序。hive可以将结构化的数据文件映射成一张表，并提供类SQL查询功能。

05

使用Spark读取Hive中的数据

在默认情况下，Hive使用MapReduce来对数据进行操作和运算，即将HQL语句翻译成MapReduce作业执行。而MapReduce的执行速度是比较慢的，一种改进方案就是使用Spark来进行数据的查找和运算。Hive和Spark的结合使用有两种方式，一种称为Hive on Spark：即将Hive底层的运算引擎由MapReduce切换为Spark，官方文档在这里：Hive on Spark: Getting Started。还有一种方式，可以称之为Spark on Hive：即使用Hive作为Spark的数据源，用Spark来读取HIVE的表数据（数据仍存储在HDFS上）。

06

0661-6.2.0-Hadoop数据备份与恢复

在Hadoop集群中，数据文件是以Block的方式存储在HDFS上，而HDFS上数据的名称，副本存储的地址等都是通过NameNode上的元数据来保存的。Hive的数据库和表的数据也是保存在HDFS中，而Hive的元数据metastore则保存在关系型数据库中。这些文件和数据如果丢失或者损坏，都会导致相应的服务不可用，Hadoop集群可以启用某些组件和服务的高可用或者备份，来应对可能出现数据损坏问题。但是在集群需要迁移，集群需要扩容或者缩容，或者其他情况，集群可能会面对数据安全风险的时候，我们可以通过主动备份这些数据，来保证数据安全。本文主要讲述如何备份NameNode元数据，如何备份MariaDB元数据库，如何备份HDFS中的数据，以及如何从这些备份中恢复。

05

Hive 0.12.0安装指南

本文的安装参照了官方的文档：GettingStarted，将Hive 0.12.0安装在Hadoop 2.4.0上。本文将Hive配置成Server模式，并且使用MySQL作为元数据数据库，远程连接MySQL。

04

快速学习-Hive 安装

（3）修改 apache-hive-1.2.1-bin.tar.gz 的名称为 hive

03

Hive on spark的搭建记录原

注：Hadoop-2.7.7、Hive-2.1.1、spark-1.6.0-bin-hadoop2.6，操作系统是Ubuntu18 64bit。最近做Hive on spark的任务，记录下。

03

写入数据到Hive表(命令行)

搭建好Hadoop和Hive的运行环境之后，首先考虑到的，就是如何将数据写入到HIVE中。这篇文章将简单、快速地介绍如何通过命令行的方式，使用insert...values、load、insert...select 语句将数据写入到hive表重。并讲解了在写入数据时遇到的问题：多个小文件，以及相应的解决方案。

03

CDP的hive3概述

Cloudera Runtime（CR）服务包括Hive和Hive Metastore。Hive服务基于Apache Hive 3.x（基于SQL的数据仓库系统）。Hive 3.x与以前版本相比的增强功能可以提高查询性能并符合Internet法规。

02

Hadoop-2.6.0为基础的Hive安装

hive服务端安装好之后，服务端如何连接使用？ * 服务端需要启动hive metastore服务，客户端才能远程使用hive元信息

02

EMR(弹性MapReduce)入门之数据仓库工具Hive组件使用（十一）

Apache Hive数据仓库软件可以使用SQL方便地阅读、编写和管理分布在分布式存储中的大型数据集。结构可以投射到已经存储的数据上。提供了一个命令行工具和JDBC驱动程序来将用户连接到Hive。

02

Hive简介

Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。

03

0521-Hadoop命令无法访问HDFS路径诡异问题解决

Fayson今天在集群中浏览HDFS数据目录时发现，通过Cloudera Manager的“文件浏览”功能可以正常的浏览某一个HDFS数据目录，如下显示：

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭