如何安装Tableau并连接CDH的Hive/Impala

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

1.文档编写目的


Tableau是桌面系统中的商业智能工具软件,可以基于不同的数据源生成漂亮的图表。Cloudera与Tableau是互相认证的合作伙伴,在Tableau的数据源配置界面可以直接找到“Cloudera Hadoop”,从而让你很方便的进行安装配置。

本文主要介绍Tableau Desktop的安装,Hive/Impala的ODBC驱动的安装,配置Tableau连接CDH以及生成你第一个图表。

  • 内容概述

1.Tableau Desktop下载安装

2.Hive/Impala的ODBC驱动下载安装

3.配置Tableau连接Hive/Impala

  • 测试环境

1.CDH5.13

2.Tableau Desktop 10.4

3.Windows Server 2008 R2,64位

4.集群未启用Kerberos

2.Tableau Desktop下载安装


1.下载Tableau Desktop的安装软件

下载地址:

https://www.tableau.com/products/trial

等待下载完成

2.双击安装程序,安装Tableau Desktop

3.等待安装完成可以看到主界面

3.下载并安装Hive的ODBC驱动


1.下载Hive的ODBC驱动

下载地址为:

https://www.cloudera.com/downloads/connectors/hive/odbc/2-5-24.html

2.5.24为目前最新版本,根据你的操作系统的实际情况选择,Fayson的电脑是Windows的系统,64位。

2.安装Hive的ODBC驱动

双击下载好的msi文件安装

4.下载并安装Impala的ODBC驱动


1.下载Impala的ODBC驱动

下载地址为:

https://www.cloudera.com/downloads/connectors/impala/odbc/2-5-40.html

2.5.40为目前最新版本,根据你的操作系统的实际情况选择,Fayson的电脑是Windows的系统,64位。

2.安装Impala的ODBC驱动

双击下载好的msi文件进行安装

5.配置Hive的ODBC连接并测试


1.进入ODBC管理界面

2.点击Add,选择Hive,点击Finish

3.弹出配置界面,输入HiveServer2的地址,因为Fayson的集群未启用Kerberos,Authentication选择“User Name”,随便输入一个用户hive。

4.点击“Test”

5.点击OK,并保存,完成配置。

6.使用Tableau连接Hive


1.进入Tableau的界面点击“more”,从而选择更多数据源

2.选择Cloudera Hadoop

3.输入CDH集群的HiveServer2的地址,因为Fayson的CDH5.13未启用Kerberos,所以Authentication选择“Username”,Username输入hive。然后点击“Sigh In”

4.进入Tableau

5.注意这里还看不到Hive中的database以及table,点击左侧“Schema”的下拉箭头。

6.点击“+”号旁边的放大镜符号,会搜索出default数据库

7.双击default

8.再次点击“+”号旁边的放大镜符号,会搜索出default数据库内的所有表

9.双击test_table选中这张表

10.点击底部的Sheet1,进入图表创建界面

11.Columns那里输入sum(s1),这时Tableau会去后端找Hive读取数据,需要一段时间

12.Rows那里输入s2,这时Tableau会去后端找Hive读取数据,同样需要一段时间。这时你第一个图表就生成了。

13.附上Hive中的这张表的数据供大家参考

7.配置Impala的ODBC连接并测试


1.进入ODBC管理界面

2.点击Add,并选择Impala,然后点击Finish

3.弹出配置界面,输入HiveServer2的地址,因为Fayson的集群未启用Kerberos,Authentication选择“No Authentication”。

4.点击Test

5.点击OK,并保存。

8.使用Tableau连接Impala


1.进入Tableau的界面点击“more”,从而选择更多数据源

2.选择Cloudera Hadoop

3.选择一台Impala Daemon的机器,将端口改为21050,Type选择Impala,因为Fayson的机器没有启用Kerberos,Authentication选择为“No Authentication”。点击“Sign In”

4.后面的操作与Hive一样,Fayson不再赘述,只是Impala的相应会更快一些,生成同样的图表如下。

至此,如何安装Tableau并连接Hive/Impala完毕,Enjoy your Tableau life!

为天地立心,为生民立命,为往圣继绝学,为万世开太平。

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

本文分享自微信公众号 - Hadoop实操(gh_c4c535955d0f)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-11-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Hadoop实操

如何使用Oozie API接口向非Kerberos环境的CDH集群提交Spark作业

在CDH集群外的节点向集群提交Spark作业的方式有多种,前面Fayson介绍了Livy相关的文章主要描述如何在集群外节点通过RESTful API接口向CDH...

36070
来自专栏Hadoop实操

如何使用R连接Hive与Impala

继之前的文章讲述如何在Redhat中配置R环境和如何在Redhat中安装R的包及搭建R的私有源后,那我们如何使用R连接CDH集群中的Hive和Impala进行数...

68960
来自专栏个人分享

Hadoop源码分类概要整理

  最近突然觉得, 很多掌握的都还是很浅的原理,需要更深入细粒度去了解整个分布式系统的运转机制。于是。。开始作死而又作死而又作死的源码之旅。

14230
来自专栏Spark学习技巧

必会:关于SparkStreaming checkpoint那些事儿

spark Streaming的checkpoint是一个利器,帮助在driver端非代码逻辑错误导致的driver应用失败重启,比如网络,jvm等,当然也仅限...

17020
来自专栏Hadoop实操

如何通过CM禁用Federation

本文主要讲述如何通过CM禁用Federation。我前面写过两篇关于Federation的文章,可参看《HDFS Federation(联邦)简介》和《如何通过...

15440
来自专栏Hadoop实操

如何通过Tableau连接Kerberos的Hive/Impala

昨天Fayson写了一篇《如何安装Tableau并连接CDH的Hive/Impala》,后台关注人数当天增加了40人,有点大大超过Fayson的预期,首先还是谢...

2.6K110
来自专栏深度学习入门与实践

【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL

  周末的任务是更新Learning Spark系列第三篇,以为自己写不完了,但为了改正拖延症,还是得完成给自己定的任务啊 = =。这三章主要讲Spark的运行...

329100
来自专栏Hadoop实操

Python3环境通过JDBC访问非Kerberos环境的Hive

在前面Fayson介绍了在Python2的环境下《如何使用Python Impyla客户端连接Hive和Impala》,本篇文章Fayson主要介绍在Pytho...

29610
来自专栏我是攻城师

CDH-Hadoop2.6+ Apache Pig0.15安装记录

37850
来自专栏星汉技术

Hadoop问题:DataNode线程不见了

35660

扫码关注云+社区

领取腾讯云代金券