我想得到一些关于我们的BI架构的建议,这是相当复杂的维护。
我在一家电子购物公司工作,我们的产品在一个LAMP系统()上工作。
每天晚上:
每次我们需要修改一个现有的工作流或创建一个新的报告时,都需要使用许多步骤和不同的技术,这就导致了一个相当复杂的平台。
我能做些什么来简化这个过程?
发布于 2014-08-26 14:51:01
您应该能够用Talend加载Palo表,将其作为数据仓库加载过程的一部分,使用所提供的Palo组件,这些组件将减少以单独的方式执行ETL操作到您的主要ETL进程。
罗伯托·马赫托( Roberto Machetto)的博客中有一些关于如何做到这一点的有意思的 教程,我相信互联网上还有很多例子,你当然可以在这里询问你遇到的任何具体问题。
一旦您的所有数据正确地加载到数据仓库和任何OLAP多维数据集中,那么您的用户就应该能够在数据存储时运行任何定制或其他查询。如果您看到用户无法访问用于分析的适当数据,那么应该通过正确理解维度建模来解决初始数据仓库/OLAP多维数据集加载中的问题。
发布于 2014-08-26 14:44:37
这有点困难,给出建议什么或不做,这取决于你的最终目标或目标。我建议您在交付OLAP多维数据集之前将数据分成几个阶段。
例如,您可以在您拥有的DW数据库中创建事实和维度,这样您就可以将数据分离为主题,这可以使您的报告构建起来更加容易,因为任何人都可以根据需要对这些数据进行分组。你可以有一个事实表只为销售,另一个为搅拌,另一个为新客户,并继续.
试着查看一下事实和维度表,或者仅仅是维度建模,这将使您的日常工作更加轻松。
一些链接:建模 http://www.learndatamodeling.com/ddm.php
https://stackoverflow.com/questions/25508374
复制相似问题