00:04
大家好,欢迎大家来到腾讯云开发者社区与腾讯云大数据团队共同打造的腾讯云维塔大数据开发与治理训练营。这一章节我们将进行数据资产的实战环节讲解,在完成数据开发、分析和安全防护之后,随着业务的发展和积累,我们在系统中沉淀了许多数据。那么,如何高效的使用和管理这些数据呢?我们可以通过数据资产管理来实现这一目标。在调查中,可以通过数据检索快速查找和使用数据。使用数据、资产管理、维护业务信息和管理信息。通过数据血缘,分析数据问题等等。下面我们进入到系统中。首先进入到维德的控制台。在这里,我们找到已经配置好的项目。
01:03
然后进入到他的数据资产模块。在数据资产总览中,我们可以看到整个平台的情况,包括总项目数、总表数和一些存储量。那这里也可以通过卡片的方式看到整个数据的全景。也可以通过我们右侧的部分找到一些热门的排行,比如说像数据的表的一个使用情况。通常情况下。我们可以通过数据检索来找到需要或者是想要使用的表。这里我输入我们的销售数据。查询出结果以后,可以通过左侧的一些条件来进行一些筛选,然后点击具体的表,我们可以看到它的基础属性,业务技术和一些基础信息。那么,这些数据是怎么而来的呢?在轨电塔中,通常我们是通过原数据采集而得来的。
02:03
在维中默认创建项目以后。根据我们项目绑定的不同类型的引擎。会自动的生成数据采集任务来实现数据的采集。在这里,我们也可以通过自定义的方式来扩展我们原数据采集的内容。选择我们需要采集的原数据类型。呃,输入数据采集的任务名称。选择我们相关的一些项目。筛选我们的类型。在这里可以看到,可以选择全量采集和整库的一部分,库的一个选择采集。在这里我们就选择一个库。然后指定我们整个表的默认的情况下的归属人。配置完以后,然后选择我们的采集资源。可以测试一下采集资源的联通性。因为原数据可能是跨网络环境的,然后再选择这里的采集周期,我们这里就选择一次性,并且配置默认采集一次。
03:07
完成之后我们就提交整个任务。可以看到,在这里生成了一条新的原数据采集任务。可以在这里去做一些详情查看。也可以在这里去点击编辑,修改我们的数据采集周期和频率,然后在这里。可以观察到我们整个任务的运行情况。可以看到,目前这个数据采集任务已经在执行之中了。好的,回到我们数据检索这个部分。还是查询这个表。然后我们点击。这表详情可以看到。这个表是我们之前创建好的一个比较重要的一个表,它除了这些基础信息以外,我们可以看到数据采集上来的技术信息。像存储大小,存储路径,还有一些存储的数据变更的一些情况。
04:01
但是对于业务信息来说,这个表是我们之前已经准备好的非常重要的一张表,但这里它没有相关的业务属性,和这里的标识也不是太太对。所以那我们怎么去更改这些信息和维护呢?在这里维中使用数据资产盘点,不过在这之前我们先去做一些业务属性的一些填写。在配置这里,我们可以去增加一些标签的信息。这个标签也是用于我们在区分业务重要性会使用到的一些信息。好,设置完这个标签以后,我们再回到资产这里,资产是通过数据资产目录的方式来展示的。在左侧它是以树形结构,我们可以自定义去扩展这个树形的一些结构,用于做业务的一些分类,那在这里我们选好的一个新建的一个目录以后,在这里去添加这里的资产。我们把刚才。这个聚合表的数据添加到这个目录之中。
05:04
啊,我们可以看到这个数据已经被添加好了,那在这里操作过程中,我们可以去选择修改它的这个标签。在这里也可以填写,我们这里修改这个表的重要性,改成重要。然后这里也可以选择一些责任人和他的生命周期。修改完成后,我们将这个资产进行一个发布。填写一些发布的信息和原因。好资产就这样被发布以后,我们再回到数据检索部分。依然搜索我们的数据,汽车销售数据,而这也可以看到我们这个数据已经被标识为是重要部分,然后这里的业务信息已经被完善和丰富了。我们可以在数据资产之中看到更多详细的数据。除了业务和技术属性,在这里我们通过一种评分机制,数据资产评分。
06:09
包括像完善性、安全性、稳定性、保障性、及时性等这样的一些要素。来对资产进行评估,用于帮助用户持续的改进我们的数据资产的质量。在这里可以看到我们这个资产,因为通过一些完善以后。它的整个的完善性相对的分数是相对比较高一点点的。我们也可以再通过其他的维度持续的去优化它。除了资产评分以外,我们可以在资产这里。看到一些其他的功能,比如说像数据预览,可以快速的预览该表的里面的数据。然后是数据学员在这里。我们可以看到整个数据的来源的上下游关系,在这里的话,就是我们这个聚合表,它的上游就是我们清洗过后的这个数据,然后再往上的话。
07:03
就是我们用于害物贴缘的一个表的数据,而这个数据呢,在网追溯就是来自于我们业务买扣的表里面的数据,从通过这样的一个方式可以看到数据的源头。以及它的一个流向。然后在数据资质的质量这里,因为我们之前配置了这个表的数据质量,在这里也可以看到它关联的这个数据质量任务。在运行过程中,目前没有看到它的报错。而后对于我们比较关注的表,可以在这里点击收藏,然后完成以后的在我的收藏里面就可以看到我们收藏的表的一些信息。通过这样的方式,可以快速的进行二次的访问。我们只要点的名称就可以再次回到这个地方。
08:01
好了,以上就是本章节的全部内容,欢迎大家到腾讯云大数据维利塔官方获得更多更全的信息。
我来说两句