前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >客快物流大数据项目(八十四):Impala优化

客快物流大数据项目(八十四):Impala优化

原创
作者头像
Lansonli
发布2022-12-20 12:56:26
5532
发布2022-12-20 12:56:26
举报
文章被收录于专栏:Lansonli技术博客Lansonli技术博客

​Impala优化

一、​​​​​​​Impala关键配置

分配给此角色的内存软限制,由 Linux 内核强制执行。当达到此限制时,内核将只在主机面

临内存压力时回收已分配给进程的页面。如果回收失败,内核可能会停止这些进程。

分配给此角色的内存硬限制,由 Linux 内核强制执行。当达到此限制时,内核将会回收已分

配给进程的页面。如果回收失败,内核可能会停止这些进程。

Impala Daemon 服务的内存限制(以字节为单位)。如果达到该限制,Impalad Daemon 上运

行的查询会被停止。

二、Impala查询分析

从 CM 主页进入 Impala 服务页面,点击查询按钮。

选择执行查询的时间范围,例如,昨天的上午 9 点到今天中午 12 点,使用 Impala 执行

过 SQL 查询。

选择一个查询,并点击右侧的“查询详细信息”。

“查询详细信息”中的 SQL 脚本。

“查询详细信息”中的 SQL 脚本对应的执行计划。

“查询详细信息”中的 SQL 脚本对应的查询耗时。

“查询详细信息”中的 SQL 脚本对应的查询实例。

每一个查询段实例名称,与查询计划中是一一对应的,查询段中包括总耗时、缓冲池内

存使用、入队和出队的内存和耗时开销。

三、​​​​​​​​​​​​​​Impala优化思路

  • 查看执行计划:explain sql;
  • 当SQL执行完成后, 使用profile输出底层的执行计划详细信息 :profile;
  • 当SQL执行完成后,使用summary输出查询时间和占用内存信息 :summary;
  • 大表和小表JOIN时,确保大表在左侧,小表在右侧( Impala 会广播小表到所有节点);
  • 大表和大表JOIN时, 需要使用partitioned join。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • ​Impala优化
    • 一、​​​​​​​Impala关键配置
      • 二、Impala查询分析
        • 三、​​​​​​​​​​​​​​Impala优化思路
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档