我们有多个源系统发送数据。理想情况下,我们应该捕获来自源的原始数据,并将其保存在数据湖中。然后,我们必须将原始数据处理为结构化格式。现在,用户可以通过前端应用程序更新这些数据。
我正在考虑在处理过的数据之上放置一个rdbms,然后将审计跟踪从rdbms拉到data,并合并处理过的数据和审计跟踪,以创建报告的最终视图。或者rdbms也可以用于分析。
或者,我们可以将所有的数据原装在rdbms中,运行rdbms中的更改,并将数据从rdbms中提取到数据湖中。但是,引入数据湖并没有多大意义。
请给我建议。
谢谢,
发布于 2018-07-03 16:35:40
ADLA不是面向消费者的,这意味着您不会将前端系统连接到它。如果问题是“我们应该做什么”,我不确定有人能为你回答这个问题,但听起来你是在正确的轨道上。
我能做的就是告诉你我们做什么:
首先将数据拖到data中,然后再将RDBMS放到数据湖中,这对我来说是有意义的。
https://stackoverflow.com/questions/51067567
复制相似问题