首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

维度模型数据仓库(十一) —— 维度层次

(五)进阶技术         6. 维度层次         大多数维度都具有一个或多个层次。例如,日期维度就有一个四级层次:年、季度、月和日。这些级别用date_dim表里的列来表示。日期维度是一个单路径层次,因为除了年-季度-月-日这条路径外,它没有任何其它层次。本篇将讨论在维度的层次上进行分组和钻取查询。多路径层次在下一篇“多路径和参差不齐的层次”中讨论。         为了识别数据仓库里一个维度的层次,首先要理解维度中列的含义。然后就可以识别两个或多个列具有相同的主题。例如,日、月、季度和年具有相同的主题因为它们都是关于日历的。具有相同主题的列形成一个组。组中的一列必须包含至少一个组内的其它成员。例如,在前面提到的组中,月包含日。这些列的链条形成了一个层次。例如,日-月-季度-年这个链条是一个日期维度的层次。除了日期维度,产品和客户维度也有层次。 表(五)- 6-1显示了三个维度的层次。注意客户维度具有两个路径的层次。

03

一个sql生成hive日期维度表

set hive.execution.engine=tez; with dates as ( select date_add("2010-01-01", a.pos) as d from (select posexplode(split(repeat("o", datediff("2030-12-31", "2010-01-01")), "o"))) a ) insert overwrite table dim.dim_date select     d   , date_format(d, 'yyyyMMdd000000') as to_pt            -- 指定分区格式   , date_format(d, 'yyyyMMdd')       as date_yyyymmdd   , trunc(d,'MM')                    as month_first_day    , last_day(d)                      as month_last_day   , date_format(last_day(d),'yyyyMMdd000000')   as month_last_pt   , date_format(d, 'yyyyMM')  as month_yyyymm   , date_format(d, 'yyyy-MM') as month_yyyy_mm   , month(d) as month   , date_format(d, 'u') as week   , date_format(d, 'E') as week_long      , weekofyear(d) as week_of_year   , year(d) as year   , floor(substr(d,6,2)/3.1)*3+1 as quarter   -- , concat_group('"',date_format(d, 'yyyyMM'),'"') as date_yyyymmdd_list   -- 低版本hive group_concat 不可用 from dates

03

没看错吧?5 行代码就能入门爬虫?

为什么当时想起写这个爬虫呢,是因为这是曾经在工作中想要解决的问题,当时不会爬虫,只能用 Excel 花了数个小时才勉强地把数据爬了下来, 所以在接触到爬虫后,第一个想法就是去实现曾未实现的目标。以这样的方式入门爬虫,好处显而易见,就是有了很明确的动力。 很多人学爬虫都是去爬网上教程中的那些网站,网站一样就算了,爬取的方法也一模一样,等于抄一遍,不是说这样无益,但是会容易导致动力不足,因为你没有带着目标去爬,只是为了学爬虫而爬,爬虫虽然是门技术活,但是如果能 建立在兴趣爱好或者工作任务的前提下,学习的动力就会强很多。

03

23 种深度学习库排行榜:TensorFlow、Keras、caffe 占据前三!

本文介绍了23种深度学习库,这些库包括TensorFlow、Keras、Caffe、Theano、Torch、MXNet、CNTK、DeepLearning4J、Gensim、R、D3、Deepnet、scikit-learn、MNIST、ImageNet、AlexNet、VGG、ResNet、MemNet、DeepLab、U-Net、Sonnet、TensorLayer、Keras、Caffe2、Paddle、Theano、NLTK、Gensim、OpenCV和scikit-image。这些库在数据科学、自然语言处理、计算机视觉和图像处理等领域得到了广泛应用。其中,TensorFlow和Keras是两种最受欢迎的深度学习库,它们都支持Python,并且Keras正在快速地成为TensorFlow的核心组件。Caffe和Theano是两种广泛使用的深度学习库,它们都支持Python和C++。其他库如MXNet、TensorLayer和Keras也支持多种编程语言,包括Python、C++和R。这些深度学习库在数据科学、自然语言处理、计算机视觉和图像处理等领域得到了广泛应用。

02
领券