首页
学习
活动
专区
工具
TVP
发布

Hadoop数据仓库

专栏作者
511
文章
707454
阅读量
108
订阅数
Greenplum 实时数据仓库实践(1)——数据仓库简介
对于每一种技术,先要理解相关的概念和它之所以出现的原因,这对于我们继续深入学习其技术细节大有裨益。实时数据仓库首先是个数据仓库,只是它优先考虑数据的时效性问题。因此本篇开头将介绍业界公认的数据仓库定义,它和操作型数据库应用的区别,以及为什么我们需要数据仓库。 在对数据仓库的概念有了基本的认识后,有必要单独说明一下ETL这个最重要的过程,然后向读者介绍四种常见的数据仓库架构。本篇最后描述实时数据仓库的产生背景、特定需求和使用场景,并列举一些常见的实时数据仓库技术架构。
用户1148526
2021-12-07
1.6K0
基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化(一)
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/52231247
用户1148526
2019-05-25
1.3K0
MADlib——基于SQL的数据挖掘解决方案(5)——数据转换之邻近度
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/78933668
用户1148526
2019-05-25
8650
MADlib——基于SQL的数据挖掘解决方案(3)——数据类型之向量
通常数据挖掘操作的数据集可以看作数据对象的集合。数据对象有时也叫做记录、点、向量、模式、事件、案例、样本、观测或实体。数据对象用一组刻画对象基本特征(如物体质量或事件发生的时间)的属性描述。属性有时也叫做变量、特性、字段、特征或维。而在数学上,向量和矩阵可以用来表示数据对象及其属性。
用户1148526
2019-05-25
1.6K0
MADlib——基于SQL的数据挖掘解决方案(26)——聚类之k-means方法
聚类算法大都是几种最基本的方法,如k-means、层次聚类、SOM等,以及它们的许多改进变种。MADlib提供了一种k-means算法的实现。本篇主要介绍MADlib的k-means算法相关函数和应用案例。
用户1148526
2019-05-25
7550
OushuDB入门(七)——OLAP篇
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/80422836
用户1148526
2019-05-25
1.1K0
MADlib——基于SQL的数据挖掘解决方案(29)——模型评估之交叉验证
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/79578574
用户1148526
2019-05-25
4850
MADlib——基于SQL的数据挖掘解决方案(10)——数据探索之主成分分析
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/79160959
用户1148526
2019-05-25
9840
MADlib——基于SQL的数据挖掘解决方案(9)——数据探索之概率统计
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/79088215
用户1148526
2019-05-25
1.3K0
触类旁通Elasticsearch:打分
使得ES查询与select * from users where name like 'bob%'查询不同的是其为文档赋予相关性得分的能力。从这个得分,可以得知文档和原始的查询有多么相关。
用户1148526
2019-05-25
1.9K0
触类旁通Elasticsearch:原理
ES被设计为处理海量数据的高性能搜索场景。海量数据具体说至少应该是数亿文档,而高性能具体说就是从数亿文档中任意搜索需要的信息,应该在秒级返回结果。既然ES的一切都是为了性能而设计,从逻辑设计和物理设计两个角度考察ES的数据组织,对于理解ES的工作原理会有帮助。
用户1148526
2019-05-25
7280
HAWQ + MADlib 玩转数据挖掘之(五)——奇异值分解实现推荐算法
一、奇异值分解简介         奇异值分解简称SVD(singular value decomposition),可以理解为:将一个比较复杂的矩阵用更小更简单的三个子矩阵的相乘来表示,这三个小矩阵
用户1148526
2018-01-03
1.3K0
HAWQ + MADlib 玩转数据挖掘之(四)——低秩矩阵分解实现推荐算法
本文介绍了推荐系统中的矩阵分解方法及其在音乐推荐中的应用。通过对比不同的数据类型和分解方法,实验结果表明,基于低秩矩阵分解的推荐算法在音乐推荐中具有较好的效果。同时,本文还探讨了如何使用隐语义模型进行音乐推荐,并分析了推荐系统的实时性和扩展性问题,为推荐系统的研究和应用提供了有益的参考。
用户1148526
2018-01-03
1.2K0
HAWQ + MADlib 玩转数据挖掘之(二)——矩阵
用户1148526
2018-01-03
1.3K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档