00:03
大家好,欢迎大家来到腾讯云开发者社区、腾讯云大数据团队共同打造的V大数据开发与治理训练营,轻松掌握,一步到位。第5章第3节。去开发。啊,我是V德塔产品经理周其仁。那上一次呢,我们通过数据集成将我们的原始数据导入到了我们的数仓,那在这一节中,我们将通过离线开发去创建我们的数据明细层,还有汇总层。啊,那第一步呢,我们去开发一个明细表啊,来找一下。在我们的画布中,大家可以在左侧看到这个,啊,SQL的一个任务啊,CQ的一个任务,那这里我们创建明细表。创建任务之后。
01:02
大家可以看到这里有一个脚本的一个画面。然后我们可以啊,回来我们的文档内去。复制一下我们的建表语句。检查一下这个库明表明。要看一下这个啊。资源组啊,数据资源组。啊,调度这边的话,我们直接去设置这个一次性的一个调度。进行一个保存和提交。这里的话,我们就写一个创建明细表。
02:02
嗯。下一步呢,我们创建了明细表。要向这个明细表里面去写入这个数据啊。还是新建同样的一个的一个任务。啊,项目明细表中。同样的,我们在这个快速入门的文档里面给大家写了一个脚本。可以直接copy past.啊,检查一下数据源,还有这个资源组。要多设置一次性。然后我们就可以保存并提交。这里这里还需要去检查一下这个。啊,透明表明啊。
03:02
检查完毕之后看一下是一共。可以保存并提交。这里我们写。新建介入任务。确认一下。那下一步呢,我们需要去创建一下这个汇总表。好,我们来看一下。同样的,新建这个的任务。创建汇总表。在这个连续复制一下,然后在这边粘贴。样的去检查一下,表明不明。数据源资源组高度设置1次。
04:03
就保存并提交。创建汇总表。就是。然后最后一个是在这个汇总表里面去写一个数据啊,同样的去新建这个任务。实际上是汇总表中是吧,加个中。确认。同样的,我们有一个建表语段,然后去粘贴一下。
05:00
这里的话一定要注意他的这个名字啊,注意它这个名字。调度设置保存。写入数据汇总表。那我们所有所需的任务就在这边了,那下一步呢,就可以通过我们对业务的理解。啊,去给他们建一个依赖。那我们这个。啊,可以点击它这个底下的两个小点啊去。去去多赚。这样就可以建立一个依赖。这里是根据我们这个场景。去搭建的这样的一个工作流。
06:00
大家可以根据自己的一个实际情况。去建立这个任务之间的关系。我拉一下。整理完之后,我们这个工作流就搭建完成了。这里可以进行一个批量提交。好,写一下这个描述。稍等一下这里。第二题叫要等一下。一个异步的过程。好,提交完之后,我们就可以对整个工作流进行一个测试。啊,这个要注意啊,不要去点击这个任务,你点击的话就相当于测试单个任务,要点到画布上,然后再去测试,就是测试整个工作者。
07:03
测试完之后,我们可以去这个任务运维去看一下它这个啊实例运行的一个情况。好,那到这里的话,我们的数据开发就结束了,下一节我们再去讲一下数据质量是怎样对我们的一个任务进行监控,保证任务的一个准确性,保证章数据不会被传导到下游。
我来说两句