文章/答案/技术大牛

发布

首页视频49_rowKey设计_需求介绍

49_rowKey设计_需求介绍

2022-12-022022-12-02 16:02:19播放29

点赞0 收藏 0

2.尚硅谷大数据学科--核心框架/尚硅谷大数据技术之HBase2.x/视频/49_rowKey设计_需求介绍.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，我们了解完基础的方法之后呢，接下来我们就来通过一个实际的案例啊来去呢，介绍一下具体的一个设计。呃，我们这个案例呢，是这样的啊，使用h base存储这个T文本里面的数据，要求呢，能够通过h base的API读取这里面的数据，完成两个统计需求啊，当然呢，呃，它有一种简单的方法，就是你单纯的把这个数据全都存到你的h base里面，存成一个表格嘛，就存成MYSQL的这种形式，然后你在读取的时候呢，只需要加过滤器就可以了啊，当然这是可以实现的啊，这是可以实现的，哎，但是这种方法呢，我们不讲啊，这没什么意义，对不对，你只要扫描全表的一个数据，经过过滤总能得到结果的啊，那这个其实效率并不高啊，效率并不高，我们不讲这种方式，我们讲的呢，是你直接通过SC扫描，直接得到你想要的那个结果。直接扫描就能得到结果，那这样的话效率就更高一点啊，你可以假设一下。整表的一个数据有十个T。
01:02
对吧，你需要得到最终的结果，数据呢，只有一个K，那你如果是扫描之后再过滤，那不就相当于把10T的数据全扫描进来了吗？这不可行，对不对，效率非常低，我们呢，推荐你直接能扫描精准到1K的数据，得到这个结果，那效率呢就会更高一点啊，我们是这样来的，好，首先呢，我们来看一下这个需求啊，把这个数据呢打开。这是我们的对应需要处理的数据，非常的简单，用户日期支付多少钱啊，那这个最终累加的结果我们也知道对吧，就是统，要么统计用户在一段时间内一共支付多少钱，要么统计一段时间内所有的用户支付了多少钱啊，咱们先把数据呢给它复制出来啊，这T不太行。我们找一个专业的文本处理。不烂啊，在这里面呢，可以看得更清楚一点啊，对应的我们把需求也给复制过来。CTRLC啊，CTRLV可以看到我们的两个需求呢，就像我刚才说的，一个是统计单个用户在一定时间范围内消费的总金额，一个呢是统计所有人在单个时间内呢消费的总金额，对吧？那无外乎呢，就这么两个最最基础的一个需求了啊，我们已经把这个数据精简到不能再精简了，记住一个业务对不对？哎，你只要了解了这个最核心的业务，也就是最基础的一个方法，哎，你遇到实际的别的需求呢，你再自己去拓展就可以了啊这是我们的整个的一个呃，R设计的需求介绍。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之HBase2.x

（43/68）

11分38秒

10_shell命令_创建查看表格

410

4分22秒

11_shell命令_修改删除表格

370

9分48秒

12_shell命令_读写数据

360

7分15秒

13_shell命令_删除与版本介绍

370

12分17秒

14_API_单线程使用连接

360

10分57秒

15_API_多线程使用连接

330

6分57秒

16_API_获取admin

420

13分7秒

17_API_创建命名空间

340

6分46秒

18_API_多异常处理

350

9分46秒

19_API_判断表格是否存在

340

7分30秒

1_HBase课程简介

450

15分5秒

20_API_创建表格

350

7分27秒

21_API_表格创建问题解决

380

9分9秒

22_API_修改表格错误代码

360

8分40秒

23_API_修改表格修正

430

5分30秒

24_API_修改表格异常处理

320

7分22秒

25_API_删除表格

380

11分41秒

26_API_写入数据

380

11分5秒

27_API_读取数据

370

11分17秒

28_API_扫描数据

390

8分22秒

29_API_单列过滤扫描

370

3分34秒

2_理论概述_定义简介

400

4分22秒

30_API_整行过滤扫描

460

8分9秒

31_API_删除数据

420

11分53秒

32_底层原理_master架构

370

11分55秒

33_底层原理_master补充信息

410

7分12秒

34_底层原理_源码与进程

330

8分55秒

35_底层原理_regionServer架构

340

11分24秒

36_底层原理_写流程

490

5分20秒

37_底层原理_memStore刷写按照大小

340

8分12秒

38_底层原理_memStore刷写条件低水位线

440

4分10秒

39_底层原理_memStore刷写条件高水位线

410

6分4秒

3_理论概述_设计理念

340

5分53秒

40_底层原理_memStore刷写条件按照时间

380

8分23秒

41_底层原理_HFile的结构

360

7分9秒

42_底层原理_写流程

380

6分34秒

43_底层原理_合并数据优化

340

4分41秒

44_底层原理_文件合并

410

8分3秒

45_底层原理_小文件合并机制

350

10分32秒

46_底层原理_自定义分区

460

8分19秒

47_底层原理_系统分区

420

6分37秒

48_rowKey设计_基础方法

370

2分26秒

49_rowKey设计_需求介绍

290

11分13秒

4_理论概述_逻辑结构与存储结构

320

7分44秒

50_rowKey设计_常规实现

300

9分49秒

51_rowKey设计_组合实现

270

5分53秒

52_rowKey设计_添加预分区

430

8分15秒

53_rowKey设计_预分区优化

400

9分46秒

54_使用调优_参数调优

380

7分21秒

55_使用调优_jvm调优

530

9分10秒

56_使用调优_权威法则

400

5分27秒

57_整合Phoenix_简介

340

6分12秒

58_整合Phoenix_安装部署

440

3分5秒

59_整合Phoenix_连接使用

400

5分17秒

5_理论概述_数据模型

400

12分11秒

60_整合Phoenix_基础命令

380

5分28秒

61_整合Phoenix_视图映射和表映射

350

4分8秒

62_整合Phoenix_数字存储问题

330

11分2秒

63_整合Phoenix_jdbc连接编写

390

7分43秒

64_二级索引_全局索引

380

4分9秒

65_二级索引_包含索引

330

4分4秒

66_二级索引_本地索引

350

9分26秒

67_集成hive_使用场景

410

4分31秒

68_集成hive_分析数据

390

9分49秒

6_理论概述_基础架构

440

9分43秒

7_集群部署_安装框架

390

2分5秒

8_集群部署_启动服务&WEB页面

350

5分20秒

9_集群部署_部署高可用

350

49_rowKey设计_需求介绍

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐