首页标签云数据仓库套件 Sparkling

#云数据仓库套件 Sparkling

简单易用、全托管、高性能、高弹性的云端分布式 PB 级数据仓库套件

大数据架构系列:如何理解湖仓一体

jhonye

腾讯 · 开发工程师 (已认证)

这十多年大数据技术蓬勃发展,从市场的表现来看基于大数据的数据存储和计算是非常有价值的,其中以云数据仓库为主打业务的公司Snowflake市值最高(截止当前449...

41070

陈胡:Apache SeaTunnel实现非CDC数据抽取实践

DataFunTalk

DataFun · 运营负责人 (已认证)

导读:随着全球数据量的不断增长,越来越多的业务需要支撑高并发、高可用、可扩展、以及海量的数据存储,在这种情况下,适应各种场景的数据存储技术也不断的产生和发展。与...

34620

使用Elasticsearch、Spark构建推荐系统 #1:概述及环境构建

flavorfan

cerence · 研究员 (已认证)

推荐系统是机器学习当前最著名、最广泛使用,且已经证明价值的落地案例。尽管有许多资源可用作训练推荐模型的基础,但解释如何实际部署这些模型来创建大型推荐系统的资源仍...

1.6K90

Spark resampling

flavorfan

cerence · 研究员 (已认证)

对时间序列的index进行resample是很常见的操作。比如,按日、周、月、季度统计用户新增、活跃、累计等,就需要对用户表进行resample操作。 pand...

37640

数仓数据处理DB基本概念解析与理解 OLAP OLTP HATP 异同 MPP架构

大鹅

学习数仓的时候,可能一开始总是被一些英文缩写名字迷惑,OLAP MPP架构 KAPPA架构 ODS等等,这篇文章就来梳理一下这些基本概念。

1.2K40

PostgreSQL-wal日志

DB之路

wal全称是write ahead log,是postgresql中的online redo log,是为了保证数据库中数据的一致性和事务的完整性。而在Post...

82220

从Snowflake看数据仓库演进方向:计算存储分离、弹性计算、统一存储和Serverless化

腾讯云大数据

2020 年 9 月,主打云数据仓库产品的硅谷独角兽 Snowflake 正式登陆纳斯达克,首日 IPO 筹资高达 33.6 亿美元,是有记录以来金额最大的软件...

50930

Greenplum性能优化之路 --(三)ANALYZE

腾讯云大数据

基于规则的优化器,就是优化器在优化查询计划的时候,是根据预先设置好的规则进行的,这些规则无法灵活改变。举个例子,索引优先于扫描,这是一个规则,优化器在遇到所有可...

56620

Spark RDD / Dataset 相关操作及对比汇总笔记

大鹅

本篇博客将会汇总记录大部分的Spark RDD / Dataset的常用操作以及一些容易混淆的操作对比。

53330

Greenplum性能分析

洛杉矶

腾讯 · 高级工程师 (已认证)

http://tapd.oa.com/Greenplum/markdown_wikis/view/#1010134541008425443

59660

Spark源码阅读的正确打开方式

用户1564362

Spark发展至今,应该说已经非常成熟了。是大数据计算领域不得不学习的框架。尤其是Spark在稳定性和社区发展的成熟度方面,吊打其他的大数据处理框架。

82720

【抗“疫”特别专题 】《腾讯云TVP直播课-数据中台是什么:数据中台剖析》

可可爱爱没有脑袋

「腾讯云大学」联合「腾讯云最具价值专家(TVP)团队」在疫情期间为开发者特推出了免费的腾讯云TVP直播课!让您足不出户,即可享受优质的学习资源,就能完成开发技能...

45260

独家 | 寻找数据统治力:比较Spark和Flink

数据派THU

本文首先介绍了Spark和Flink的发展背景、基本架构及其设计特点,然后从数据模型、状态处理和编程模型3个角度进行比较优势和限制,最后介绍Spark和Flin...

38220

FeignClient源码深度解析

方志朋

大体步骤: 一、注册FeignClient配置类和FeignClient BeanDefinition 二、实例化Feign上下文对象FeignContext ...

1.8K50

基于Spark的机器学习实践 (八) - 分类算法

JavaEdge

华为 · 软件开发工程师 (已认证)

贝叶斯定理(英语:Bayes' theorem)是概率论中的一个定理,描述在已知一些条件下,某事件的发生概率。

65730

基于Spark的机器学习实践 (七) - 回归算法

JavaEdge

华为 · 软件开发工程师 (已认证)

◆ 在回归分析中,自变量与因变量之间满足或基本满足线性关系,可以使用线性模型进行拟合

98140

云数据仓库套件Sparkling简介

腾讯云数仓与数据湖团队

腾讯 · (已认证)

云数据仓库套件 Sparkling(Tencent Sparkling Data Warehouse Suite)基于业界领先的 Apache Spark 框架...

5.1K100

扫码关注腾讯云开发者

领取腾讯云代金券