腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
Hadoop数据仓库
专栏作者
举报
511
文章
707454
阅读量
108
订阅数
订阅专栏
申请加入专栏
全部文章
sql
数据库
云数据库 SQL Server
编程算法
大数据
数据处理
hive
hadoop
http
正则表达式
mysql
oracle
云数据库 Redis
网络安全
bash
regexp
bash 指令
java
linux
存储
spark
数据分析
数据挖掘
unix
tcp/ip
https
字符串
node.js
mongodb
数据
set
apache
云数据库 MongoDB
云推荐引擎
hbase
es
函数
html
mapreduce
网站
分布式
缓存
数据迁移
date
机器学习
xml
postgresql
面向对象编程
数据库管理
专用宿主机
TDSQL MySQL 版
腾讯云测试服务
数据可视化
product
脚本
其他
api
神经网络
深度学习
人工智能
shell
线性回归
schema
部署
测试
内容分发网络 CDN
负载均衡
打包
文件存储
ssh
数据结构
实时数仓
kettle
null
select
table
集群
配置
索引
javascript
jquery
nosql
spring
yarn
zookeeper
Elasticsearch Service
data
insert
redis
row
编码
产品
集合
事务
语法
ios
jar
容器镜像服务
容器
开源
迁移
clickhouse
extract
grid
innodb
rows
session
text
镜像
连接
数据仓库
数据同步
搜索
c++
php
go
ecmascript
ruby on rails
lucene/solr
windows server
负载均衡缓存
日志服务
命令行工具
数据安全
express
sql server
jdbc
决策树
安全
windows
kafka
unicode
alpha
count
csv
db
disk
fetch
h2
ip
key
model
predict
project
substr
xls
对象
后台
解决方案
客户端
命令行
内存
统计
弹性伸缩
官方文档
python
ruby
lua
json
arm
嵌入式
memcached
git
github
搜索引擎
analyzer
centos
apt-get
SSL 证书
数据备份
日志数据
云数据库 MySQL
serverless
parcel
运维
爬虫
yum
推荐系统
rabbitmq
gcc
socket编程
机器人
nest
任务调度
sdn
聚类算法
分类算法
utf8
ascii
学习方法
数据集成
add
amp
apollo
authentication
awk
byte
cat
code
connect
counter
crontab
d3
deadlock
delimiter
digits
etl
factory
greenplum
host
hostname
im
join
matrix
min
monitor
ode
panel
partition
performance
position
proc
production
progress
replace
sentinel
sequence
server
sh
split
state
status
storage
string
swap
system
tar
tree
txt
version
view
zip
备份
变量
程序设计
磁盘
存储过程
代理
服务
服务器
规范化
进程
权限
入门
设计
实践
树形结构
同步
系统
效率
协议
性能
优化
原理
指针
标签
搜索文章
搜索
搜索
关闭
Greenplum 实时数据仓库实践(1)——数据仓库简介
数据挖掘
大数据
数据可视化
编程算法
数据库管理
对于每一种技术,先要理解相关的概念和它之所以出现的原因,这对于我们继续深入学习其技术细节大有裨益。实时数据仓库首先是个数据仓库,只是它优先考虑数据的时效性问题。因此本篇开头将介绍业界公认的数据仓库定义,它和操作型数据库应用的区别,以及为什么我们需要数据仓库。 在对数据仓库的概念有了基本的认识后,有必要单独说明一下ETL这个最重要的过程,然后向读者介绍四种常见的数据仓库架构。本篇最后描述实时数据仓库的产生背景、特定需求和使用场景,并列举一些常见的实时数据仓库技术架构。
用户1148526
2021-12-07
1.6K
0
基于hadoop生态圈的数据仓库实践 —— OLAP与数据可视化(一)
hive
hadoop
数据挖掘
大数据
html
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/52231247
用户1148526
2019-05-25
1.3K
0
MADlib——基于SQL的数据挖掘解决方案(5)——数据转换之邻近度
编程算法
数据挖掘
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/78933668
用户1148526
2019-05-25
865
0
MADlib——基于SQL的数据挖掘解决方案(3)——数据类型之向量
编程算法
数据挖掘
数据分析
通常数据挖掘操作的数据集可以看作数据对象的集合。数据对象有时也叫做记录、点、向量、模式、事件、案例、样本、观测或实体。数据对象用一组刻画对象基本特征(如物体质量或事件发生的时间)的属性描述。属性有时也叫做变量、特性、字段、特征或维。而在数学上,向量和矩阵可以用来表示数据对象及其属性。
用户1148526
2019-05-25
1.6K
0
MADlib——基于SQL的数据挖掘解决方案(26)——聚类之k-means方法
机器学习
聚类算法
编程算法
数据挖掘
大数据
聚类算法大都是几种最基本的方法,如k-means、层次聚类、SOM等,以及它们的许多改进变种。MADlib提供了一种k-means算法的实现。本篇主要介绍MADlib的k-means算法相关函数和应用案例。
用户1148526
2019-05-25
755
0
OushuDB入门(七)——OLAP篇
数据挖掘
数据处理
数据可视化
存储
数据库
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/80422836
用户1148526
2019-05-25
1.1K
0
MADlib——基于SQL的数据挖掘解决方案(29)——模型评估之交叉验证
spring
数据挖掘
腾讯云测试服务
编程算法
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/79578574
用户1148526
2019-05-25
485
0
MADlib——基于SQL的数据挖掘解决方案(10)——数据探索之主成分分析
数据分析
编程算法
数据挖掘
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/79160959
用户1148526
2019-05-25
984
0
MADlib——基于SQL的数据挖掘解决方案(9)——数据探索之概率统计
数据挖掘
sql
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/79088215
用户1148526
2019-05-25
1.3K
0
触类旁通Elasticsearch:打分
编程算法
es
数据挖掘
Elasticsearch Service
使得ES查询与select * from users where name like 'bob%'查询不同的是其为文档赋予相关性得分的能力。从这个得分,可以得知文档和原始的查询有多么相关。
用户1148526
2019-05-25
1.9K
0
触类旁通Elasticsearch:原理
es
ecmascript
数据挖掘
编程算法
数据库
ES被设计为处理海量数据的高性能搜索场景。海量数据具体说至少应该是数亿文档,而高性能具体说就是从数亿文档中任意搜索需要的信息,应该在秒级返回结果。既然ES的一切都是为了性能而设计,从逻辑设计和物理设计两个角度考察ES的数据组织,对于理解ES的工作原理会有帮助。
用户1148526
2019-05-25
728
0
HAWQ + MADlib 玩转数据挖掘之(五)——奇异值分解实现推荐算法
数据挖掘
编程算法
一、奇异值分解简介 奇异值分解简称SVD(singular value decomposition),可以理解为:将一个比较复杂的矩阵用更小更简单的三个子矩阵的相乘来表示,这三个小矩阵
用户1148526
2018-01-03
1.3K
0
HAWQ + MADlib 玩转数据挖掘之(四)——低秩矩阵分解实现推荐算法
数据挖掘
编程算法
本文介绍了推荐系统中的矩阵分解方法及其在音乐推荐中的应用。通过对比不同的数据类型和分解方法,实验结果表明,基于低秩矩阵分解的推荐算法在音乐推荐中具有较好的效果。同时,本文还探讨了如何使用隐语义模型进行音乐推荐,并分析了推荐系统的实时性和扩展性问题,为推荐系统的研究和应用提供了有益的参考。
用户1148526
2018-01-03
1.2K
0
HAWQ + MADlib 玩转数据挖掘之(二)——矩阵
数据挖掘
分布式
sql
机器学习
用户1148526
2018-01-03
1.3K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档