如何在Hue中配置Impala的负载均衡

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。 Fayson的github:https://github.com/fayson/cdhproject 提示:代码块部分可以左右滑动查看噢

1.文档编写目的


在前面的文章Fayson介绍了《如何使用HAProxy实现Impala的负载均衡》、《如何使用HAProxy实现Kerberos环境下的Impala负载均衡》和《如何使用Nginx实现Impala负载均衡》。本篇文章主要基于Haproxy方式实现的Impala负载均衡在Hue中配置Impala服务的负载均衡。

  • 内容概述

1.测试环境描述

2.Hue配置Impala负载均衡

3.测试Impala负载均衡

4.总结

  • 测试环境

1.CM和CDH版本为5.13.1

2.Haproxy版本为1.5.18

  • 前置条件

1.已配置好Haproxy实现的Impala负载均衡

2.环境描述


在CDH集群中使用Haproxy配置Impala服务的负载均衡,具体可参看Fayson前面的文章《如何使用HAProxy实现Impala的负载均衡》。

注:上图标注部分impalajdbc必须配置,否则在Hue中无法配置Impala的负载均衡。

Haproxy的配置如下:

global
    # to have these messages end up in /var/log/haproxy.log you will
    # need to:
    #
    # 1) configure syslog to accept network log events.  This is done
    #    by adding the '-r' option to the SYSLOGD_OPTIONS in
    #    /etc/sysconfig/syslog
    #
    # 2) configure local2 events to go to the /var/log/haproxy.log
    #   file. A line like the following can be added to
    #   /etc/sysconfig/syslog
    #
    #    local2.*                       /var/log/haproxy.log
    #
    log         127.0.0.1 local2
    chroot      /var/lib/haproxy
    pidfile     /var/run/haproxy.pid
    maxconn     4000
    user        haproxy
    group       haproxy
    daemon
    # turn on stats unix socket
    stats socket /var/lib/haproxy/stats
#---------------------------------------------------------------------
# common defaults that all the 'listen' and 'backend' sections will
# use if not designated in their block
#---------------------------------------------------------------------
defaults
    mode                    http
    log                     global
    option                  httplog
    option                  dontlognull
    #option http-server-close
    #option forwardfor       except 127.0.0.0/8
    option                  redispatch
    retries                 3
    timeout http-request    10s
    timeout queue           1m
    timeout connect         10s
    timeout client          1m
    timeout server          1m
    timeout http-keep-alive 10s
    timeout check           10s
    maxconn                 3000
listen stats
    bind 0.0.0.0:1080
    mode http
    option httplog
    maxconn 5000
    stats refresh 30s
    stats  uri /stats 
listen hivejdbc
    bind 0.0.0.0:10099
    mode tcp
    option tcplog
    balance source
    server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:10000 check
    server ip-172-31-6-148.fayson.com ip-172-31-6-148.fayson.com:10000 check
listen impalashell
    bind 0.0.0.0:25003
    mode tcp
    option tcplog
    balance leastconn
    server cdh04.fayson.com cdh04.fayson.com:21000 check
    server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21000 check
    server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21000 check
listen impalajdbc
    bind 0.0.0.0:25004
    mode tcp
    option tcplog
    balance source
    server cdh04.fayson.com cdh04.fayson.com:21050 check
    server ip-172-31-5-190.fayson.com ip-172-31-5-190.fayson.com:21050 check
    server ip-172-31-10-118.fayson.com ip-172-31-10-118.fayson.com:21050 check

(可左右滑动)

3.修改Hue配置


1.使用管理员登录Cloudera Manager的WEB控制台,进入hue服务的配置项页面

2.在配置项搜索”hue_safety_valve.ini”,在该配置项增加如下配置

[impala]
server_host=ip-172-31-7-172.fayson.com
server_port=25004

配置项说明:

server_host: Haproxy服务的HOSTNAME或IP地址。

server_port: Haproxy中配置监听的impalajdbc的端口25004。

3.保存配置,回到CM主页根据提示重启Hue及相关服务

4.测试Impala是否正常访问


这里我们使用两个浏览器登录Hue,来对Impala进行操作,查看Haproxy是否有负载均衡。

1.使用谷歌浏览器登录Hue,执行SELECT操作

查看此时Haproxy的监控界面,可以看到使用谷歌浏览器登录操作Impala连接的是ip-172-31-10-118.fayson.com节点的Impala Daemon服务

2.使用Safari浏览器登录Hue,执行SELECT操作

SQL执行成功,查看此时Haproxy的监控界面,可以看到使用Safari浏览器登录操作Impala连接的是cdh04.fayson.com节点的Impala Daemon服务

5.总结


  • 在Hue中配置连接多个ImpalaDaemon需要先配置Impala服务JDBC的负载均衡。
  • 在配置impalajdbc的Haproxy时需要将负载均衡的策略指定为balance source否则在使用时会报“Results have expired, rerun the query ifneeded”
  • balance source是将用户的IP地址经过Hash计算后制定到固定的服务器上。

提示:代码块部分可以左右滑动查看噢 为天地立心,为生民立命,为往圣继绝学,为万世开太平。 温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操

本文分享自微信公众号 - Hadoop实操(gh_c4c535955d0f)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-02-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

编辑于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Hadoop实操

如何在Hue中调优Impala和Hive查询

Hue中使用Hive和Impala进行查询,在使用完Hue后退出登录,会出现Hive和Impala的暂用的资源未释放。本篇文章Fayson主要针对该问题在Hue...

1.6K40
来自专栏Hadoop实操

Sentry赋予server1权限给hive以外用户时ACL不同步问题分析

在使用Sentry赋予server1所有权限给hive以外的用户时(如:fayson用户默认用户组也是fayson),通过Hue使用fayson用户登录,Sen...

63150
来自专栏闵开慧

job监控与hadoop权限管理

监测Hadoop控制中心及作业运行状况 MapReduce框架由一个单独的Master JobTracker和集群节点上的Slave TaskTracker共...

433120
来自专栏Hadoop实操

如何在CDH集群中安装Hive2.3.3

77030
来自专栏加米谷大数据

编译及调试 Hadoop 源代码

Hadoop 在伪分布式模式下的编译和调试方法,其中,调试方法主要介绍使用 Eclipse 远程调试和打印调试日志两种。 编译 Hadoop 源代码 在 Win...

47560
来自专栏Hadoop实操

CDH高可用集群误删NameNode故障恢复

在已启用HA的CDH集群中,误删Standby Namenode服务,导致集群异常,无法再次通过CM启用HA。异常如下

936120
来自专栏Hadoop实操

在同时使用Hive+Sentry,因HMS死锁导致的高并发写入工作负载时,查询速度缓慢或者停滞

21950
来自专栏Hadoop实操

5.如何为Impala配置OpenLDAP认证

在前面的文章Fayson讲了《1.如何在CentOS6.5安装OpenLDAP并配置客户端》、《2.OpenLDAP集成SSH登录并使用SSSD同步用户》、《3...

63440
来自专栏Hadoop实操

如何在Hue中集成配置Hive2.3.3服务

20860
来自专栏Hadoop实操

如何在CDH集群外配置Kerberos环境的Spark2和Kafka客户端环境

31130

扫码关注云+社区

领取腾讯云代金券