首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何在GCP中执行数据沿袭?

如何在GCP中执行数据沿袭?
EN

Stack Overflow用户
提问于 2019-03-05 18:40:15
回答 2查看 2.4K关注 0票数 5

当我们使用GCP云存储实现数据湖,并使用Dataproc、Dataflow等云服务进行数据处理时,我们如何在GCP中生成数据沿袭报告?

EN

回答 2

Stack Overflow用户

发布于 2019-03-25 08:59:14

Google Cloud Platform没有提供无服务器的数据谱系。

相反,您可能希望在Google Cloud Dataproc上安装Apache Atlas,并将其用于数据沿袭。

票数 4
EN

Stack Overflow用户

发布于 2020-11-19 13:22:11

Google Cloud Data Fusion在企业版中支持谱系。您可以使用DF来构建和编排管道,并使用Dataproc和Dataflow作为运行它们的容量。CDF谱系简介可在以下文档中找到:https://cloud.google.com/data-fusion/docs/tutorials/lineage

如果您不使用CDF功能,那么仅仅使用谱系就有点夸张了。Google Cloud Data Catalog中的谱系功能将是最佳的,至少在我的许多用例中是这样。不幸的是,目前CDC不支持谱系。我希望它在产品路线图上,它将在未来支持谱系。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55000865

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档