温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,接下来呢,我们讲一下这个属于原数据管理,那原数据管理这块呢,在数仓啊,数仓这个项目里面属于非常非常重要的一个地位哈,目前各大公司呢,都在争先恐后的去做这个原数据管理,包括呢,前两周吧,前两周啊,咱们一个京东老学员,他是在京东的。呃,数据中台他们呢,现在就提出了要做这个原数据管理,数据质量监控啊,还有这个像这个权限管理,嗯,这一套叫什么呢?叫数据治理,哎,这是一个大的学名哈,叫数写的什么。叫数据治理,哎以后呢,一说到数据数据治理啊,你不要蒙啊,其实数据治理呢,是统一的数仓的一个管理系统,它这里面呢,嗯,包含很多子系统,比如说子系统里面,它要求要有原数据管理。还要求什么呢?像这个数据质量。
01:06
嗯。数据质量,呃,还有一块,也就是说它属于要求必备的叫嗯。权限管理啊,权限管理这么几块呢,目前当前比较流行的,你像用这个做原数据管理用的最多的Atlas。然后呢,数据质量这块GRFN啊格瑞son,当然这格瑞呢,其实它不太好用,非常不好用啊呃,他才0.4版本。当前官网可能升级了,升级完之后呢,也就0.5。呃,用起来呢,实在是麻烦啊,呃,必须要重新编译。对你的网络要求非常高啊,同时呢,它能实现的功能呢,也非常简单,其实它实现的功能我们都可以用什么来实现呢?用自己写脚本。
02:00
就可以把它实现了啊,那再往下呢,像这个权限管理,权限管理的话,我们可以用什么呢?Range啊range还有三。咱们后会讲这个C么。啊,人物认证。啊,等等一系列这个系统,那这些呢,就组成了这个数据治理啊,回头让我有一本书啊,可以大家哈,是一个老外写的吧。嗯,虽然说比较老,但是应该呢,是看一下我收一下啊。看能不能收到啊。数据治理。治理,哎,对,这本书哈,嗯,我复制出来,回头给大家发一下,这是目前市面上唯一的一本数据治理的书。
03:11
简单露眼,呃,这里面包括哈。看商,呃,这个是con哈,另另一个框架S呢,主要处理这个原数据管理,还有呢ranger ranger呢是负责权限呢,也是数据权限,Keep认证,其实这个呢是也是权限当中的一种,那这些系统就组成了它对应的大数据治理,你看大数据治理与安全从理论到实践的一个东西,其实不是特别难,对吧?啊不是特别难,回头呢,把这本书发给大家。嗯,当然了,那个我们要实践一下这个对吧。
我来说两句