查看hive的端口_查看hive端口_hive查看端口 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

0846-7.1.1-如何迁移HDP2.4中的Hive表到CDP7.1.1

随着Hadoop 3.X 版本的发展，Hadoop 2.X 版本即将淘汰。我们当前面临着集群升级的问题，在升级过程中，即使使用迁移升级方式工作量非常大，但毫无疑问最稳妥的升级办法。在迁移的过程中，我们首先面对的就是本地的HDFS数据迁移和Hive 表数据迁移，本文主要讲述如何迁移HDP2.4.2 Hive 表和数据到CDP 7.1.1中。

03

如何在CDH集群中安装Hive2.3.3

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。 Fayson的github：https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 ---- 本篇文章主要介绍如何在CDH集群中配置及部署Hive2.3.3版本的服务，在配置及部署Hive2服务的同时不停用CDH集群默认的Hive服务。内容概述 1.环境准备 2.配置及部署Hive2.3.3服务 3.Hive2.3.3服务启动及功能验证测试环境 1.CM和CDH版本为5

04

您找到你想要的搜索结果了吗？

是的

没有找到

数据分析EPHS(3)-来试试Hive的可视化吧～

这里需要使用hive中的HiveServer2服务，使用该服务相当于在hive的机器上启动一个server，而客户端可以通过ip + port的方式对其进行访问，然后，就可以通过客户端来实现我们可视化的需求。

02

如何启动HiveServer2

HiveServer2 是一种可选的 Hive 内置服务，可以允许远程客户端使用不同编程语言向 Hive 提交请求并返回结果。HiveServer2 是 HiveServer1 的改进版，主要解决了无法处理来自多个客户端的并发请求以及身份验证问题。具体可以参阅一起了解一下HiveServer2。下面我们具体看一下如何配置 HiveServer2。

02

大数据入门基础系列之浅谈Hive的用户接口

09

HAProxy实现HiveServer2负载均衡

开启： service haproxy start 或 systemctl start haproxy

00

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。 Fayson的github： https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 ---- 在前面的文章Fayson介绍了《如何在CDH中启用Spark Thrift》,《如何在Kerberos环境下的CDH集群部署Spark1.6 Thrift及spark-sql客户端》，《如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql

05

spark单机模式简单搭建

待安装列表 hadoop hive scala spark 一.环境变量配置： ~/.bash_profile PATH=$PATH:$HOME/bin

01

如何在Kerberos环境下的CDH集群部署Spark1.6 Thrift及spark-sql客户端

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。 Fayson的github： https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 ---- 在前面的文章Fayson介绍了《如何在CDH中启用Spark Thrift》，本篇文章Fayson主要介绍如何在Kerberos环境下的CDH集群中部署Spark1.6的Thrift Server服务和Spark SQL客户端。内容概述 1.部署Spark Thrift 2.启

04

如何在Kerberos环境下的CDH集群部署Spark2.1的Thrift及spark-sql客户端

温馨提示：要看高清无码套图，请使用手机打开并单击图片放大查看。 Fayson的github： https://github.com/fayson/cdhproject 提示：代码块部分可以左右滑动查看噢 1.文档编写目的 ---- 在前面的文章Fayson介绍了《如何在CDH中启用Spark Thrift》和《如何在Kerberos环境下的CDH集群部署Spark1.6 Thrift及spark-sql客户端》，本篇文章Fayson主要介绍如何在非Kerberos环境下的CDH集群中部署Spark2.1的T

03

如何使用HAProxy实现HiveServer2负载均衡

前面Fayson介绍了《如何使用HAProxy实现Impala的负载均衡》，本文主要介绍如何使用HAProxy实现Hive服务的负载均衡。

04

「EMR 开发指南」之通过 Python 连接 Hive

Hive 中集成了 Thrift 服务。Thrift 是 Facebook 开发的一个软件框架，它用来进行可扩展且跨语言的服务的开发。Hive 的 HiveServer2 就是基于 Thrift 的，所以能让不同的语言如 Java、Python 来调用 Hive 的接口。本节将演示如何使用 Python 代码来连接 HiveServer2。

05

推荐一款可视化+NoteBook工具

Apache Zeppelin是一个让交互式数据分析变得可行的基于网页的开源框架。Zeppelin提供了数据分析、数据可视化等功能。

06

比hive快10倍的大数据查询利器-- presto

目前最流行的大数据查询引擎非hive莫属，它是基于MR的类SQL查询工具，会把输入的查询SQL解释为MapReduce，能极大的降低使用大数据查询的门槛，让一般的业务人员也可以直接对大数据进行查询。但因其基于MR，运行速度是一个弊端，通常运行一个查询需等待很久才会有结果。对于此情况，创造了hive的facebook不负众望，创造了新神器---presto，其查询速度平均比hive快10倍，现在就来部署体验一下吧。

04

大数据集群搭建之Linux安装Hive2.3.2

GettingStarted - Apache Hive - Apache Software Foundation

02

sparksql（1）——Dataframe

sparksql类似于hive，但它基于内存，而hive基于mapreduce，而mapreduce又基于磁盘，所以spark处理数据快得多。 sparksql不止有sql语句，现在他还有Dataframe的API，Dataframe比写RDD要快。dataframe将非结构化数据schema化。 sparksql类比于hive可以发现，hive在mapreduce上做了一个框架，而sparksql是在spark core里的rdd里面多出来的一个框架，并且还多了dataframe这样的简便框架，dataframe最终也是转换为RDD的操作前提：打开spark—master和spark—slave（前面有讲过，我们用的是standalone模式，由master和worker去操作driver和executer）（1）首先打开jupyter

02

Hadoop（五）C#操作Hive

Hive将HiveQL（类sql语言）转为MapReduce，完成数据的查询与分析，减少了编写MapReduce的复杂度。它有以下优点：

03

EMR入门学习之使用Java连接Hive（十）

Hive 中集成了 Thrift 服务。Thrift 是 Facebook 开发的一个软件框架，它用来进行可扩展且跨语言的服务的开发。Hive 的 HiveServer2 就是基于 Thrift 的，所以能让不同的语言如 Java、Python 来调用 Hive 的接口。对于 Java，Hive 提供了 jdbc 驱动，用户可以使用 Java 代码来连接 Hive 并进行一系列操作。

04

Hive快速入门系列(5) | 如何访问HiveJDBC

我们在启动hiveserver2服务以后，会发现光标静止不动，这不是执行完了的标志，是等待在等待，我们可以通过下图看出来：

02

python 连接 hive

在网上搜索关键字 python hive 的时候可以找到一些解决方案。大部分是这样的，首先把hive 根目录下的$HIVE_HOME/lib/py拷贝到 python 的库中，也就是 site-package 中，或者干脆把新写的 python 代码和拷贝的 py 库放在同一个目录下，然后用这个目录下提供的 thrift 接口调用。示例也是非常简单的。类似这样：

01

CDP Base使用RM同步数据

Cloudera Replication Manager（以下简称为 RM,旧版本的CM中简称为BDR）为数据迁移提供了一个集成式的易用管理解决方案，通过界面化的方式可以非常便捷的定义不同集群之间的数据复制操作，本文主要介绍如何配置及使用RM进行HDFS和Hive 复制

01

如何安装SAS并配置连接Hive/Impala

SAS提供了从基本统计数的计算到各种试验设计的方差分析，相关回归分析以及多变数分析的多种统计分析过程，几乎囊括了所有最新分析方法，其分析技术先进，可靠。分析方法的实现通过过程调用完成。许多过程同时提供了多种算法和选项。Cloudera与SAS是相互认证的合作伙伴，在各自的官网都能找到集成安装的专业文档，也能得到专业的支持。本文主要是介绍如何安装SAS，并连接配置到Hive和Impala。

大数据Presto（二）：Presto安装搭建

https://prestodb.io/docs/current/installation/deployment.html#installing-presto

07

「EMR 开发指南」之通过 Java 连接 Hivesever2

Hive 中集成了 Thrift 服务。Thrift 是 Facebook 开发的一个软件框架，它用来进行可扩展且跨语言的服务的开发。Hive 的 HiveServer2 就是基于 Thrift 的，所以能让不同的语言如 Java、Python 来调用 Hive 的接口。对于 Java，Hive 提供了 jdbc 驱动，用户可以使用 Java 代码来连接 Hive 并进行一系列操作。本节将演示如何使用 Java 代码来连接 HiveServer2

0792-5.16.2-如何通过Hive跨集群迁移Kudu表

在日常使用中你的Kudu 集群版本非常低或者部署在其他非CDH集群中，迁移起来非常麻烦。本文主要介绍如何通过Hive 进行跨集群迁移Kudu 表

04

Hive

Hive.png Hive 运行方式命令行脚本 jdbc webui 搭建模式 local 单用户模式远程模式/多用户模式一般模式 Beeline · 服务器hiveserver2启动 · 客户端beeline连接 HQL 建表（create）内部表 · hive管理，删除表时源数据消失外部表 · 非hive管理，删除表时源数据不消失查看表描述（desc） DML 和sql基本类似，用到查询即可分区静态分区动态分区分桶适用场景抽样 map-join 索引提高检索性能 SerDe

00

0473-如何使用Python3访问Kerberos环境的Hive和Impala

随着Hadoop平台的流行，越来越多的开发语言访问Hadoop平台的组件，比较常见的Java、Scala、Python、R等。在前面的多篇文章中Fayson介绍了Java和Scala访问Hadoop各个组件的方法。对于偏分析类的Python和R语言访问集群的Hive和Impala比较多。本篇文章Fayson主要介绍如何使用Python3访问Kerberos环境的Hive和Impala。

03

CDH+Kylin三部曲之三：Kylin官方demo

Yarn的内存参数设置之后一定要重启Yarn使之生效，否则Kylin提交的任务是会由于资源限制而无法执行；

02

如何在Kerberos环境下使用Haproxy实现HiveServer2负载均衡

前面Fayson介绍了《如何使用HAProxy实现HiveServer2负载均衡》，本文主要介绍如何使用HAProxy实现Kerberos环境下HiveServer2的负载均衡。

03

Linux大数据Hadoop生态组件常用命令速查手册

因为spark的群起命令会和hdfs的命令冲突，所以spark执行命令时使用绝对路径。

01

大数据环境搭建-HBase和Zookeeper

HBase 主要用ZooKeeper来实现 HA 选举与主备集群主节点的切换、系统容错、meta-region 管理、Region 状态管理和分布式 SplitWAL 任务管理等。

05

hive_学习_02_hive整合hbase（失败）

本文承接上一篇：hive_学习_01_hive环境搭建(单机) ，主要是记录 hive 整合hbase的流程

02

0474-如何使用SQL Developer访问Hive

Fayson在前面的文章也介绍了几款SQL客户端工具用来访问CDH集群的Hive和Impala，本篇文章Fayson再介绍一款Oracle的SQL客户端工具SQL Developer，使用该工具访问Kerberos环境下的Hive。

02

hive之路4-CLI和Beeline

beeline是hiveserver2的CLI，一个JDBC的客户端，分为两种模式

01

如何在CDH中启用Spark Thrift

CDH 自带的Spark 不支持Spark Thrift，因为spark-assembly jar中缺少Hive thrift相关的依赖包，导致CDH用户没法使用JDBC的方式连接Spark并使用Spark SQL。Apache Spark 1.6之后spark-assembly jar 中包含了 Hive 相关的依赖包了，而恰好 CDH5.13 的 spark也是 1.6，所以可以直接使用Apache Spark 1.6 之后的spark-assembly jar替换CDH的。

09

助力工业物联网，工业大数据之ODS层构建：代码结构及修改【九】

ColumnMeta.py：Oracle列的信息对象：用于将列的名称、类型、注释进行封装

01

Hive远程模式安装

Hadoop的安装略，JDK的安装略。安装在192.168.33.33这台机器上。

02

Windows10系统下Hadoop和Hive开发环境搭建填坑指南

笔者目前需要搭建数据平台，发现了Windows系统下，Hadoop和Hive等组件的安装和运行存在大量的坑，而本着有坑必填的目标，笔者还是花了几个晚上的下班时候在多个互联网参考资料的帮助下完成了Windows10系统下Hadoop和Hive开发环境的搭建。这篇文章记录了整个搭建过程中的具体步骤、遇到的问题和对应的解决方案。

04

如何在Hue中配置HiveServer2的负载均衡

在前面的文章Fayson介绍了《如何使用HAProxy实现HiveServer2负载均衡》和《如何使用Zookeeper实现HiveServer2的HA》。本篇文章主要基于Haproxy方式实现的Hive负载均衡在Hue中配置HiveServer2服务的负载均衡。

04

0641-5.16.1-如何禁用CDH5.16.1的Kerberos

Fayson在前面的文章介绍了如何为CDH集群启用Kerberos，在集群启用Kerberos后，会对现有环境的部分代码做改造，有些人觉得使用起来不方便，想取消Kerberos。本篇文章Fayson主要介绍如何禁用CDH集群的Kerberos及禁用后对各组件服务的测试。

04

Ambari安装hive服务，数据库Connection Failed

因为写 ambari 相关的文章比较多，所以有很多使用 ambari 的朋友加我好友，发现有很多初学者都会卡在一个地方，就是安装依赖 mysql 的服务会提示：MYSQL Connection: Error ，像安装 hive、oozie、ranger 等等服务都会遇到这个问题。

06

实时即未来，车联网项目之将数据落地到文件系统和数据库【三】

azkaban airflow dolphinscheduler oozie 自研

01

使用 Replication Manager 迁移到CDP 私有云基础

这是CDH/HDP/Apache Hadoop迁移到CDP系列的第一篇博客，如对迁移感兴趣，请关注该系列博客。

01

慕课网Spark SQL日志分析 - 4.从Hive平滑过渡到Spark SQL

老版本文档：http://spark.apache.org/docs/1.6.1/

03

Linux下Spark开发环境搭建

10、服务器集群：192.168.0.110(master)，192.168.0.111(slave1)，192.168.0.112(slave2)

02

0708-5.16.2-如何将CM内嵌PostgreSQL服务迁移至外部PostgreSQL服务

Cloudera Manager提供了一个嵌入式PostgreSQL数据库服务，用于在创建集群时进行演示和概念验证部署。为了提醒用户此嵌入式数据库不适合生产，Cloudera Manager将显示横幅文本：“您正在非生产模式下运行Cloudera Manager，该模式使用嵌入式PostgreSQL数据库。切换到使用支持的外部数据库，然后再投入生产”。

01

0710-6.3.0-如何将CM内嵌PostgreSQL服务迁移至外部PostgreSQL服务

Cloudera Manager提供了一个嵌入式PostgreSQL数据库服务，用于在创建集群时进行演示和概念验证部署。为了提醒用户此嵌入式数据库不适合生产，Cloudera Manager将显示横幅文本：“您正在非生产模式下运行Cloudera Manager，该模式使用嵌入式PostgreSQL数据库。切换到使用支持的外部数据库，然后再投入生产”。

02

0694-5.10.2--如何将CM内嵌PostgreSQL服务迁移至外部PostgreSQL服务

Cloudera Manager提供了一个嵌入式PostgreSQL数据库服务，用于在创建集群时进行演示和概念验证部署。为了提醒用户此嵌入式数据库不适合生产，Cloudera Manager将显示横幅文本：“您正在非生产模式下运行Cloudera Manager，该模式使用嵌入式PostgreSQL数据库。切换到使用支持的外部数据库，然后再投入生产“。

03

Hadoop基础教程-第12章 Hive：进阶（12.3 HiveServer2）（草稿）

该文介绍了如何使用HiveServer2和HiveServer1来连接Hive数据库。其中，HiveServer2是Hive 2.0版本后引入的，提供了多租户支持、认证和授权、以及基于Zookeeper的动态服务发现机制。而HiveServer1是Hive 1.x版本中的Server组件，使用Java编写的Thrift API来提供Hive功能。在配置HiveServer2时，需要配置HiveServer2的地址、端口、Thrift协议、以及Zookeeper集群的信息。通过HiveServer2，可以实现多租户、资源隔离、访问控制、日志审计等功能。在安全性方面，HiveServer2提供了用户、角色、数据库和表级别的访问控制，并且支持SSL/TLS和Kerberos安全协议。在性能方面，HiveServer2采用了分桶表和列存存储，可以大幅提高查询性能。此外，HiveServer2还支持通过插件来扩展功能，例如支持自定义函数、存储格式、数据类型等。总之，HiveServer2提供了更加安全、高效、易用的数据库服务，适用于各种规模的企业应用。

08

一脸懵逼学习Hive（数据仓库基础构架）

Hive是什么？其体系结构简介* Hive的安装与管理* HiveQL数据类型，表以及表的操作* HiveQL查询数据*** Hive的Java客户端** Hive的自定义函数UDF* 1：什

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭