文章/答案/技术大牛

发布

首页视频54-数据导出-查询结果导出-语法&并发导出

54-数据导出-查询结果导出-语法&并发导出

2022-12-022022-12-02 16:02:30播放42

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷大数据技术之Apache Doris/视频/54-数据导出-查询结果导出-语法&并发导出.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
好，接下来我们介绍一下另外一种导出方式，直接将查询结果导出，那它呢，其实就是用一个select into out fire这么一个语法来实现，那它目前支持主要有三种方式，第一种还是依赖于broker。对吧，第二一种直接依赖于S3啊，直接导出到S3，也还有一种就直接导出到HDFS。只要支持对应的协议就可以啊，那具体语法就是这样啊。查询语法，哎，比如说我查询的某张表，Ne新flow某张表，然后呢，Into out fire。然后再指定一个文件的路径，还有前缀，同时呢，可以指定一个导出时的一个存储格式。还有一些导出任务的属性，来我们具体看一下几个细节啊，首先第一个这个文件路径啊，它指向的是什么。存储的路径及前缀啊，这个是要注意的地方啊，举个例子，我这个fire pass写的是这样，这是不是一个HDFS路径啊，那么到前面为止是个路径，那最后一个斜杠后面的表示导出文件的前缀，举个例子。
01:18
我们如果指定是买。就是这个路径下面，那最终它生成的导出文件是这个样子啊。假设我们这个format指定的是CSV的话啊，对吧，那就是my fire这个前缀啊，那后面呢，就有一个序号由零开始，零啊一啊二啊，这样就看你被分成几次导出嘛啊分割成几次好。另外就格式。啊，导出格式不指定，默认就是一个CSV也可以支持pack，那properties就是指定相关属性了，那我们说了它支持什么brokeer s3协议或HDFS协议，对吧？那在哪指定呢？就是在属性这一块指定的啊。
02:06
那我们后面直接看案例就行了啊。好。呃，那这边呃，还有一些其他的属性啊，要跟大家说一下啊，那比如说这里一个列的分隔符，列的分隔符就是说你是逗号啊还是什么的都可以啊，那默认呢是杠T。而且大家要注意仅对什么CSV格式适用，你要么就改成CSV，要么就别改啊，那航母分隔符一般我们也不会改，都是斜杠N对吧？还有一个我们要注意的，之前我们说这个的时候会拼接一个后缀，从零开始，那到底有几个呢？就取决于这个值最大文件大小，就最终单个文件的最大大小默认为一个G啊。
03:06
超过这个大小，文件就会被切分。比如说我导出的文件有十个G。导出的数据量有十个G，那这个值为1G，那最终导出的时候就会生成十个文件，那序号就是从零到九，对吧？就这个意思，那它取值范围也不是随便取的，必须在五兆到两个G之间，另外一个STEM信息，这个是导出为pack的列式，存储的时候必须要指定啊park格式，必须指定一个STEM。好，这是我们一个基本语法，另外介绍一个事儿，叫并发导出，那么大家要注意我们这种查询结果的导出啊，它默认都是单点导出。如果你想提高它的效率，使用一个并发导出，那是有条件的啊。第一个有一个参数我们要开启，这个是一个会画级变量，我们直接set就行，把它支呃设为true就行，临时set一下啊。另外一个方式，并发导出不支持broker，因为什么呢？因为broker本身就是并发的啊。
04:15
本身就是并并行的，那专门就是为这个S3或者HDFS直接导入这种方式啊，第三一个顶层不能包含salt等单点节点。那具体是什么意思呢？我后面会给大家说一下，其实现在说也行，就很简单，你的语法不能有salt，不能sortt，就排序啊，不能加order by，呃。对吧，不能有order by能理解吧，就是这个意思，满足以上三个条件就能够去执行并发导出啊，那它的并发度是怎么决定呢？实力、数量。乘以这个这个这个这两个参数吧。那么怎么验证呢？我们可以通过spring啊执行计划去看，那这边就一个关键点啊，如果我们可以看到result fire s这个计划是在。
05:11
这个计划一里面，那说明是并行导出，那如果不是在一，而是在零里面，说明不是并行导出啊，就只能通过这么去看了。好了，这个是我们前面给大家介绍一下。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之Apache Doris

（54/92）

3分21秒

01-课程介绍

500

9分8秒

02-Doris简介-概述

470

11分17秒

03-Doris简介-架构

660

10分33秒

04-Doris编译-安装Docker

570

16分42秒

05-Doris编译-使用Docker镜像编译

480

10分32秒

06-安装要求-软硬件需求

480

5分14秒

07-安装要求-默认端口号

430

9分7秒

08-集群部署-拷贝编译后文件&修改系统限制

390

12分20秒

09-集群部署-部署并启动FE

350

11分23秒

10-集群部署-部署BE

470

12分21秒

11-集群部署-向FE添加BE并启动

510

9分40秒

12-集群部署-部署FS_Broker

400

13分46秒

13-扩容缩容-FE扩缩容

410

4分55秒

14-扩容缩容-BE和Broker的扩缩容

360

9分24秒

15-数据表创建-基本概念

490

11分42秒

16-建表示例-基本语法&字段类型

370

7分53秒

17-建表示例-建表示例介绍

410

14分22秒

18-数据划分-列定义&分区

500

19分28秒

19-数据划分-分桶&多列分区

400

8分36秒

20-数据划分-表属性&引擎

380

9分12秒

21-数据模型-Aggregate模型介绍

390

8分12秒

22-数据模型-Aggregate模型-导入数据聚合演示

410

3分45秒

23-数据模型-Aggregate模型-保留明细数据演示

420

8分8秒

24-数据模型-Aggregate模型-导入数据与已有数据聚合演示

420

4分30秒

25-数据模型-Uniq模型

400

2分26秒

26-数据模型-Duplicate模型

450

7分5秒

27-数据模型-选择建议&聚合模型局限性

410

8分0秒

28-动态分区-原理&使用方式

420

12分52秒

29-动态分区-动态分区规则参数&创建历史分区

380

10分50秒

30-动态分区-动态分区演示

440

16分56秒

31-Rollup-Aggregate模型和Uniq模型的Rollup使用

390

8分35秒

32-Rollup-Duplicate模型的Rollup使用

340

3分28秒

33-Rollup-几点说明

370

7分45秒

34-物化视图-简单介绍&与Rollup区别

550

17分15秒

35-物化视图-原理介绍

510

6分41秒

36-物化视图-案例一演示

430

3分14秒

37-物化视图-案例二演示

290

3分57秒

38-物化视图-案例三演示

390

10分6秒

39-修改表-rename和partition的操作

310

5分32秒

40-删除数据-两种方式

430

7分13秒

41-数据导入-概述

320

18分14秒

42-数据导入-BrokerLoad-原理&语法

420

16分16秒

43-数据导入-BrokerLoad-示例演示

460

10分52秒

44-数据导入-StreamLoad方式

440

9分49秒

45-数据导入-Routine Load语法及参数说明

440

13分8秒

46-数据导入-Routine Load使用演示

510

12分29秒

47-数据导入-BinlogLoad-原理&配置MySQL端

370

8分59秒

48-数据导入-BinlogLoad-配置Canal端

370

3分42秒

49-数据导入-BinlogLoad-准备Doris表&基本语法

410

11分19秒

50-数据导入-BinlogLoad-示例演示

350

3分23秒

51-数据导入-Insert into及S3导入方式的说明

390

6分2秒

52-数据导出-Export方式-原理

470

10分2秒

53-数据导出-Export方式-示例演示

380

5分31秒

54-数据导出-查询结果导出-语法&并发导出

420

13分26秒

55-数据导出-查询结果导出-示例演示

420

7分59秒

56-查询设置-查询内存&查询超时时间

450

28分17秒

57-查询设置-查询重试和高可用&ProxySQL使用演示

370

7分57秒

58-查询-简单查询

460

11分49秒

59-Join查询-Broadcast Join&Shuffle Join

370

15分27秒

60-Join查询-Colocation Join

360

12分8秒

61-Join查询-Bucket Shuffle Join

370

12分47秒

62-Join查询-Runtime Filter原理&使用

350

14分50秒

63-Join查询-Runtime Filter参数说明

420

7分15秒

64-查询-SQL函数说明

460

12分20秒

65-集成Spark-使用Spark-Doris-Connector

880

4分34秒

66-集成Spark-官方Connector的配置项及字段映射

370

3分30秒

67-集成Spark-使用JDBC的方式（不推荐）

350

16分47秒

68-集成Flink-演示

340

12分12秒

69-集成DataX-编译DorisWriter&集成到DataX

350

9分39秒

70-集成DataX-案例演示

450

6分24秒

71-ODBC外部表-使用方式介绍

370

25分21秒

72-ODBC外部表-MySQL外表

440

16分31秒

73-ODBC外部表-Oracle外表

500

9分1秒

74-Doris On ES-原理和使用演示

370

7分9秒

75-Doris On ES-几个建表参数&使用注意

450

19分34秒

76-监控和报警-使用Prometheus和Grafana

430

10分36秒

77-优化-查看QueryProfile统计信息

360

9分31秒

78-优化-Join Reorder

450

10分54秒

79-优化-导入导出任务参数调整

460

6分19秒

80-优化-Bitmap索引&BloomFilter索引

420

4分55秒

81-优化-合理设置分桶分区数

340

8分7秒

82-数据备份及恢复-说明

370

9分18秒

83-数据备份及恢复-备份演示

570

8分35秒

84-数据备份及恢复-恢复演示

380

12分49秒

85-1.0新特性-1.0版本的部署

410

11分7秒

86-1.0新特性-向量化执行引擎

390

4分20秒

87-1.0新特性-Hive外表介绍

420

7分36秒

88-1.0新特性-Hive外表使用示例

400

9分22秒

89-1.0新特性-Table Function函数

400

4分49秒

90-1.0新特性-mySQLDump功能

340

4分35秒

91-1.0新特性-版本通告介绍(1)

330

4分35秒

91-1.0新特性-版本通告介绍

370

54-数据导出-查询结果导出-语法&并发导出

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐