首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

基于Hadoop生态圈的数据仓库实践 —— 进阶技术

三、维度子集 有些需求不需要最细节的数据。例如更想要某个月而不是某天的记录。再比如相对于全部的销售数据,可能对某些特定状态的数据更感兴趣等。这些特定维度包含在从细节维度选择的行中,所以叫维度子集。维度子集比细节维度的数据少,因此更易使用,查询也更快。 本节中将准备两个特定维度,它们均取自现有的维度:月份维度(日期维度的子集),Pennsylvania州客户维度(客户维度的子集)。 1. 建立月份维度表 执行下面的脚本建立月份维度表。注意月份维度不包含promo_ind列,该列不适用月层次上,因为一个月中可能有多个促销期,而且并不是一个月中的每一天都是促销期。促销标记适用于天这个层次。

01

基于Hadoop生态圈的数据仓库实践 —— 进阶技术(三)

三、维度子集         有些需求不需要最细节的数据。例如更想要某个月而不是某天的记录。再比如相对于全部的销售数据,可能对某些特定状态的数据更感兴趣等。这些特定维度包含在从细节维度选择的行中,所以叫维度子集。维度子集比细节维度的数据少,因此更易使用,查询也更快。         本节中将准备两个特定维度,它们均取自现有的维度:月份维度(日期维度的子集),Pennsylvania州客户维度(客户维度的子集)。 1. 建立月份维度表         执行下面的脚本建立月份维度表。注意月份维度不包含promo_ind列,该列不适用月层次上,因为一个月中可能有多个促销期,而且并不是一个月中的每一天都是促销期。促销标记适用于天这个层次。

02

Informix 常用函数

一、内部函数   1、内部合计函数     1)COUNT(*)          返回行数     2)COUNT(DISTINCT COLNAME)   返回指定列中唯一值的个数     3)SUM(COLNAME/EXPRESSION)   返回指定列或表达式的数值和;     4)SUM(DISTINCT COLNAME)    返回指定列中唯一值的和     5)AVG(COLNAME/EXPRESSION)   返回指定列或表达式中的数值平均值     6)AVG(DISTINCT COLNAME)    返回指定列中唯一值的平均值     7)MIN(COLNAME/EXPRESSION)   返回指定列或表达式中的数值最小值     8)MAX(COLNAME/EXPRESSION)   返回指定列或表达式中的数值最大值   2、日期与时间函数     1)DAY(DATE/DATETIME EXPRESSION)   返回指定表达式中的当月几号     2)MONTH(DATE/DATETIME EXPRESSION)  返回指定表达式中的月份     3)YEAR(DATE/DATETIME EXPRESSION)   返回指定表达式中的年份     4)WEEKDAY(DATE/DATETIME EXPRESSION) 返回指定表达式中的当周星期几     5)DATE(NOT DATE EXPRESSION)     返回指定表达式代表的日期值     6)TODAY                返回当前日期的日期值     7)CURRENT[first to last]        返回当前日期的日期时间值     8)COLNAME/EXPRESSION UNITS PRECISION  返回指定精度的指定单位数     9)MDY(MONTH,DAY,YEAR)       返回标识指定年、月、日的日期值     10)DATETIME(DATE/DATETIME EXPRESSION)FIRST TO LAST 返回表达式代表的日期时间值     11)INTERVAL(DATE/DATETIME EXPRESSION)FIRST TO LAST 返回表达式代表的时间间隔值     12)EXTEND(DATE/DATETIME EXPRESSION,[first to last])返回经过调整的日期或日期时间

03

《最新出炉》系列初窥篇-Python+Playwright自动化测试-30-处理日历时间控件-下篇

理想很丰满现实很骨感,在应用playwright实现web自动化时,经常会遇到处理日期控件点击问题,手工很简单,可以一个个点击日期控件选择需要的日期,但自动化执行过程中,完全复制手工这样的操作就有点难了或者是有些复杂啰嗦而且麻烦不过相对于selenium来说,playwright已经很好了。宏哥上一篇已经讲解了如何处理日历时间控件,但是有些网站不知道出于什么原因,对于第一种方法可能会遇到输入框是readonly的情况,禁止输入文本。那么第一种方法就不适用了,但是只要我们换个思路然后稍微的变通地处理一下,就又可以使用了。

05

《最新出炉》系列初窥篇-Python+Playwright自动化测试-30-处理日历时间控件-下篇

理想很丰满现实很骨感,在应用playwright实现web自动化时,经常会遇到处理日期控件点击问题,手工很简单,可以一个个点击日期控件选择需要的日期,但自动化执行过程中,完全复制手工这样的操作就有点难了或者是有些复杂啰嗦而且麻烦不过相对于selenium来说,playwright已经很好了。宏哥上一篇已经讲解了如何处理日历时间控件,但是有些网站不知道出于什么原因,对于第一种方法可能会遇到输入框是readonly的情况,禁止输入文本。那么第一种方法就不适用了,但是只要我们换个思路然后稍微的变通地处理一下,就又可以使用了。

01

维度模型数据仓库(十二) —— 多路径和参差不齐的层次

(五)进阶技术         7. 多路径和参差不齐的层次         本篇讨论多路径层次,它是对单路径层次的扩展。上一篇里数据仓库的月维度只有一条层次路径,即年-季度-月这条路径。在本篇中加一个新的级别,推广期,并且加一个新的年-推广期-月的层次路径。这时月维度将有两条层次路径,因此具有多路径层次。本篇讨论的另一个主题是不完全层次,这种层次在它的一个或多个级别上没有数据。         增加一个层次         执行清单(五)- 7-1里的脚本给month_dim表添加一个叫做campaign_session的新列,并建立campaign_session_stg过渡表。图(五)- 7-1显示添加后的模式。

02
领券