我有桌面桌面。我用5个表中的5个表创建了一个报告,2个表很大。这些表被联接并应用筛选器。提取创建需要很长时间(6-7小时,并且仍在运行)。大表有100+列,我只用了12列来构建我的报告。现在,有一个选项可以使用自定义SQL,它创建提取所需的时间更少,但是我无法充分利用tableau的潜力。欢迎任何建议。我正在寻找我可以选择用于创建摘录的列的名称。
发布于 2018-02-18 01:24:27
请遵循以下流程:
建立数据库连接
连接表
转到工作表并获取报告中所需的必填字段,然后右键单击connection并创建解压缩文件,然后不要忘记单击Hide unused fields
,然后应用所需过滤并创建解压缩文件
此过程应该只向您显示所有字段中的必填字段。
特别是对于非常大的提取,您还可以在提取时考虑聚合到可见维度的选项。这可以极大地减少提取的大小以及创建和访问它的时间。但这种选择需要小心,以确保您以一种仍能获得准确结果的方式使用较快的提取。该功能中内置了一些假设。
提取实际上是缓存的查询结果。如果您在创建提取时执行聚合,您可以在提取创建过程中计算总计、最小值、最大值、平均值等,然后在Tableau中简单地显示聚合值。这可以节省很多时间。当然,在这种情况下,您不能进一步深入到摘录中的细节级别。
更重要的是,如果您在Tableau中执行进一步的聚合,则必须小心,以确保双重聚合得到您想要的结果。有些函数总是安全的--sum,min的min,maxes的maxes总是给出相同的答案,就好像你只做了一个大的聚合操作。这些被称为加法运算。其他组合可能会给出你想要的结果,也可能不会给出你想要的结果,平均值,当然countd的countd可能是意想不到的-尽管有时重复聚合可以很好地定义-例如,每日总和的平均值可能是有意义的。
因此,在提取创建期间执行聚合可以在可视化时带来巨大的性能收益-您可以有效地预先计算需要显示的大部分或所有信息。你只需要理解它是如何工作的,并相应地使用它。实验。
顺便说一句,该特性使用为数据源中的每个度量定义的默认聚合。通常是SUM()。您可以在数据窗格中对其进行更改。
https://stackoverflow.com/questions/48838758
复制相似问题