前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >大数据实战【千亿级数仓】阶段五

大数据实战【千亿级数仓】阶段五

作者头像
大数据梦想家
发布2021-01-27 16:15:31
3970
发布2021-01-27 16:15:31
举报

写在前面: 博主是一名软件工程系大数据应用开发专业大二的学生,昵称来源于《爱丽丝梦游仙境》中的Alice和自己的昵称。作为一名互联网小白,写博客一方面是为了记录自己的学习历程,一方面是希望能够帮助到很多和自己一样处于起步阶段的萌新。由于水平有限,博客中难免会有一些错误,有纰漏之处恳请各位大佬不吝赐教!个人小站:http://alices.ibilibili.xyz/ , 博客主页:https://alice.blog.csdn.net/ 尽管当前水平可能不及各位大佬,但我还是希望自己能够做得更好,因为一天的生活就是一生的缩影。我希望在最美的年华,做最好的自己

本篇博客,为大家带来的是关于大数据实战【千亿级数仓】阶段五的内容。

在这里插入图片描述
在这里插入图片描述

该阶段中我们需要达成的目标有:

  • 学习、掌握kylin的使用,使用kylin,为数据仓库内的数据进行预计算

关于Kylin的入门及使用安装,具体的内容可以参考博主写的kylin专栏的内容: ?Kylin

所以本篇博客,为大家带来的则是如何将Kylin与我们的数仓项目进行结合,即使用Kylin,为数据仓库内的ads层结果数据进行预计算处理。

基于Kylin开发Ads层

项目需求介绍

因为业务需要,公司运营部门,希望随时能够自己编写SQL语句,快速获取到不同维度数据的指标,故基于Kylin OLAP分析平台,搭建快速OLAP分析平台。

业务开发

开发步骤:

  1. 创建 itcast_shop 项目
  2. 导入dw层宽表数据
  3. 创建数据模型
  4. 创建Cube立方体
  5. 构建立方体
  6. 执行查询

具体操作步骤:

在kylin中导入数据源

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

创建model

在这里插入图片描述
在这里插入图片描述

指定model名称:

在这里插入图片描述
在这里插入图片描述

选择事实表:

在这里插入图片描述
在这里插入图片描述

创建完了Model,接着我们需要创建Cube,创建Cube就需要根据我们根据业务需求中所书写的SQL语句进行操作。

这里举一个在前面阶段我们所求得的SQL指标的例子。

全国、无商品分类维度的交易信息

需求:

  1. 获取全国、无商品分类维度的分交易类型数据
  2. 获取全国、无商品分类维度的不分交易类型的数据

对应的SQL

代码语言:javascript
复制
-- 获取全国、无商品分类维度的分交易类型数据
select
    paytype,
    count(distinct orderid) total_cnt,
    sum(goodsprice) total_money
from
    itcast_dw.TMP_ORDER_GOODS_CAT_ORG
group by paytype;

-- 获取全国、无商品分类维度的不分交易类型的数据
select
    '9' as paytype,
    count(distinct orderid) total_cnt,
    sum(goodsprice) total_money
from
    itcast_dw.TMP_ORDER_GOODS_CAT_ORG;
全国、一级商品分类维度交易信息

需求:

  1. 获取全国、一级商品分类维度的分交易类型数据
  2. 获取全国、一级商品分类维度的不分交易类型数据

对应的SQL

代码语言:javascript
复制
-- 1、获取全国、一级商品分类维度的分交易类型数据
select
    firstcat,
    paytype,
    count(distinct orderid) total_cnt,
    sum(goodsprice) total_money
from
    itcast_dw.TMP_ORDER_GOODS_CAT_ORG
group by firstcat, paytype;

-- 2、获取全国、一级商品分类维度的不分交易类型数据
select
    firstcat,
    count(distinct orderid) total_cnt,
    sum(goodsprice) total_money
from
    itcast_dw.TMP_ORDER_GOODS_CAT_ORG
group by firstcat;

获取到SQL指标之后,我们就可以创建Cube立方体,并build构建立方体,最后再根据SQL语句,在线进行查询即可。

因为这里面所涉及到的Kylin基本的流程操作。而博主在之前的博客kylin入门实操已经为大家较为详细地介绍了kylin的操作流程,所以这里就不再做过多的赘述。

大家在领悟了Kylin的基本流程之后,根据已有的SQL,利用Kylin进行加速查询还是比较容易的。

小结

大数据实战【千亿级数仓】阶段五的内容到这里就结束了。大家需要在了解Kylin基本操作的基础上,对我们数仓项目ads数据层的数据进行预处理,加速查询!!!

如果以上过程中出现了任何的纰漏错误,烦请大佬们指正?

受益的朋友或对大数据技术感兴趣的伙伴记得点赞关注支持一波?

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-05-20 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 基于Kylin开发Ads层
    • 项目需求介绍
      • 业务开发
      • 全国、无商品分类维度的交易信息
      • 全国、一级商品分类维度交易信息
  • 小结
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档