创建数据集

最近更新时间:2019-07-24 10:35:18

组合数据集具有强大且易用的数据查询治理功能。可视化拖拽操作使您轻松自助准备数据。
本节以联接数据为例,向您介绍如何联接数据,形成新的数据集。数据集联接的效果如下图所示:

您可以使用产品内置的示例数据集“咖啡中国市场销售数据”和“咖啡中国门店订单数据”,按照下文的步骤,联接数据。

1. 进入组合数据集

在登录后首页左侧引导区或中间区域选择【创建数据集】>【组合数据集】,进入创建组合数据集界面。

2. 编辑数据集

  1. 在数据集列表中,先后拖拽“咖啡中国市场销售数据”和“咖啡中国门店订单数据”到数据集编辑区。
  2. 系统自动识别联接列,对两个数据集进行联接。默认采用“内部联接”。您也可以改变数据集之间的联接方式和联接列。
  3. 单击【刷新元数据】,得到联接后的元数据。

3. 新建日期表达式

数据分析中,时间是常见的分析维度,帮助展示特定时间的数据信息或趋势。为了在制作报告时,展示时间维度下的数据信息,您需要在元数据区创建所需的时间维度。

  1. 在交易时间数据列,【更多】菜单中选择【新建日期表达式】。
  2. 选择日期表达式的格式为【年月】。
  3. 维度区域出现您刚建立的时间维度“YearMonth_交易时间”,系统自动将“年月”作为该时间维度的别名。

4. 保存数据集

单击菜单栏【保存】,保存该数据集为“咖啡中国市场数据联接表”。

5. 进入制作报告

在保存窗口中,单击【保存并制作报告】,可直接在保存数据集的同时,进入制作报告界面。