文章/答案/技术大牛

发布

首页视频03_概述_SeaTunnel的特点和应用场景

03_概述_SeaTunnel的特点和应用场景

2022-12-022022-12-02 16:02:31播放46

点赞0 收藏 0

尚硅谷大数学科--选学技术丰富/尚硅谷大数据技术之SeaTunnel（从入门到成为源码贡献者）/视频/03_概述_SeaTunnel的特点和应用场景.mp4

原链接：http://www.atguigu.com/

视频文本

温馨提示：文本由机器自动转译，部分词句存在误差，以视频为准

00:00
那么接下来呢，我们来看一下这个塔的应用场景。啊，我们可以看到哈，就翻回来看这个图就是C他弄的，他其实自己没有自己的一个呃计算引擎，也没有自己处理这个数据同步的一个一套引擎啊，它是它是用什么呢？它实际上是把配置文件翻译成具体的Spark和flink任务，这样的话呢，它就是以Spark和fli为引擎，也就是说这些同步任务是由弗Li和Spark这种分布式计算框架去做的啊这样的一个好处呢，就是它是分布式的啊，其实数据同步呢，我们可以想到还有什么呀，还有data叉。但是data叉有个什么问题呢？就是它data塔叉是单点的，就它只能是在单机上运行，而他弄呢，它可以借助Spark和框架的能力啊，来把这个数据同步呢，做成一个分布式的，分布式的事情。所以说我们可以看看官网对自己的一个介绍，也就是其他弄的它适用于什么场景的，呃，其实这个数据的同步，数据的集成，这个都是我们常见的，关键是海量。啊，实际上关键是海量，也就是塔诺，它可以通过分布式来避免单机的瓶颈，那么后面这些都是塔诺的一些特点，这个之前我们都已经介绍过了，关键是什么呢？目前来说它是支持circle进行数据操作和数据聚合，你后面会发现，就是说目前啊，社区推荐的这个数据处理的方式，还是用circle来进行处理。
01:15
我们继续往下看，呃，下面呢，这是一个真实的场景。嗯，这是一个典型的数据集成的问题，实际上这个是唯品会在他周会上去分分享的一个自己企业的案例。啊，我们可以看到就是说这个唯品会呢，他们内部之前呢，就已经有了一套数据系统啊，但是呢，啊，后面的这个又做了一个新的olp，他们使用了click house，但是因为这个house呢，出来的它这个东西比较晚。那么出来的比较晚呢啊，有一些生态又没做好，比如说连接器就比较少啊，这样一来的话呢，它以前的这个数据系统呢，它已经可以实现一个互相的导通，但很可惜的是呢，Click house不能很好的去接入这个系统啊，所以说呢，他们后面是采用了什么方案呢？就是用了塔诺。
02:00
呃，用can诺的连接器呢，因为can诺连接器比较丰富，它把这个click click house读进来，于是的话，Can诺就和这个系统，哎，直接融合进来了啊，也就是说避免了click house作为一个。数据孤岛的问题。那我们可以看到这个文档上说的，也就是斯塔诺，它现在的长板呢，就是它有丰富的连接器，它的连接器比较多，然后完了之后伊斯bug和普尼克微引擎可以分布式的进行海量数据同步。然后呢，我们就可以看一下这个吉他的工作流程，这个是官方的一个图，我们可以看到哈，它就是说它的。源比较丰富，它支持的数据源比较丰富，然后支持向外的连接器也比较丰富，然后中间的这个就是我们之前说那个配置文件里面抽象出来的三个层次，也就是说上来是数据源，哎，Data source input，数据的输入完了之后，Transform对数据进行一个处理，然后最后呢，Think把数据输出出去啊，这就是他的一整个流程。

展开

我来说两句

0 条评论

登录后参与评论

作者

腾讯云开发者课程

【合辑】尚硅谷大数据技术之SeaTunnel（从入门到成为源码贡献者）

（3/22）

1分30秒

01_SeaTunnel_课程介绍

570

5分38秒

02_概述_SeaTunnel简介

510

3分2秒

03_概述_SeaTunnel的特点和应用场景

460

2分4秒

04_概述_SeaTunnel目前支持的插件

530

4分54秒

05_入门_安装和部署

520

11分1秒

06_入门_快速上手小案例

570

6分22秒

07_原理解读_基本原理——启动脚本

350

4分35秒

08_原理解读_在配置文件中使用变量

370

4分35秒

09_原理解读_向flinkrun传递参数

330

7分13秒

10_原理解读_SeaTunnel的核心数据结构

510

7分30秒

11_原理解读_Source块与文档带读

430

10分53秒

12_原理解读_transform插件&split和sql插件源码

460

52秒

13_原理解读_sink块

420

13分31秒

14_原理解读_SeaTunnel核心源码

530

5分0秒

15_原理解读_框架总结

510

12分48秒

16_应用案例_kafka进kafka出的简单ETL

550

16分22秒

17_应用案例_kafka到doris 进行指标统计

730

12分47秒

18_如何参与开源项目_基本概念

380

17分23秒

19_如何参与开源项目_如何改bug

430

10分22秒

20_如何参与开源项目_创建issue

280

15分19秒

21_如何参与开源项目_创建pull request

330

5分16秒

22_成功成为源码贡献者

370

03_概述_SeaTunnel的特点和应用场景

我来说两句

作者

相关推荐

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐