腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
腾讯大数据的专栏
专栏成员
举报
328
文章
479332
阅读量
125
订阅数
订阅专栏
申请加入专栏
全部文章(328)
大数据(172)
机器学习(41)
数据库(37)
编程算法(33)
spark(26)
腾讯(26)
深度学习(25)
sql(24)
神经网络(24)
开源(24)
angel(24)
数据处理(20)
人工智能(18)
分布式(17)
hadoop(17)
数据(17)
jdk(16)
数据分析(16)
https(16)
apache(14)
存储(14)
网络安全(14)
微信(13)
游戏(12)
运维(12)
java(11)
云数据库 SQL Server(10)
腾讯云开发者社区(10)
联邦学习(10)
数据结构(9)
云直播(8)
hive(8)
隐私计算(7)
数据湖(7)
优化(7)
postgresql(6)
api(6)
腾讯移动推送(6)
容器(6)
安全(6)
其他(5)
ios(5)
node.js(5)
linux(5)
容器镜像服务(5)
短视频(5)
TDSQL MySQL 版(5)
kubernetes(5)
小程序(5)
系统架构(5)
腾讯移动分析(4)
数据安全(4)
缓存(4)
jvm(4)
推荐系统(4)
云计算(4)
flink(4)
数据挖掘(3)
android(3)
打包(3)
github(3)
文件存储(3)
文字识别(3)
mongodb(3)
网站(3)
企业(3)
serverless(3)
数据可视化(3)
微服务(3)
数据集成(3)
基础(3)
架构(3)
开发者(3)
模型(3)
实践(3)
视频(3)
NLP 服务(2)
自动驾驶(2)
python(2)
ide(2)
git(2)
微信小程序音视频(2)
数据迁移(2)
html5(2)
pytorch(2)
模式识别(2)
任务调度(2)
特征工程(2)
性能测试(2)
Elasticsearch Service(2)
智能客服机器人(2)
大数据存储(2)
腾讯云(2)
软件(2)
系统(2)
费用中心(1)
私有网络(1)
对象存储(1)
语音识别(1)
人脸识别(1)
创业扶持(1)
iphone(1)
php(1)
javascript(1)
jquery(1)
单片机(1)
oracle(1)
云数据库 Redis(1)
mvc(1)
svn(1)
spring(1)
mapreduce(1)
容器服务(1)
消息队列 CMQ 版(1)
SSL 证书(1)
知识图谱(1)
腾讯计费(1)
腾讯云测试服务(1)
图像处理(1)
高性能计算(1)
日志数据(1)
电商(1)
金融(1)
o2o(1)
出行(1)
http(1)
yarn(1)
云+未来(1)
devops(1)
压力测试(1)
无人驾驶(1)
图像识别(1)
强化学习(1)
sql server(1)
jdbc(1)
决策树(1)
zookeeper(1)
自动化测试(1)
tcp/ip(1)
gcc(1)
迁移学习(1)
机器人(1)
架构设计(1)
图片加速(1)
kafka(1)
虚拟化(1)
安全治理(1)
sdk(1)
迁移(1)
raft(1)
腾讯广告算法大赛(1)
数据接入平台(1)
数据库管理(1)
流计算 Oceanus(1)
移动推送(1)
可信计算(1)
教育(1)
app(1)
bi(1)
im(1)
wifi(1)
报表(1)
编程(1)
编译器(1)
并发(1)
产品(1)
行业(1)
互联网(1)
集群(1)
解决方案(1)
开发(1)
客户端(1)
论文(1)
内存(1)
搜索(1)
统计(1)
网络(1)
芯片(1)
研发(1)
硬件(1)
智慧城市(1)
搜索文章
搜索
搜索
关闭
Firestorm - 腾讯自研Remote Shuffle Service在Spark云原生场景的实践
spark
serverless
大数据
存储
sql
图片来源:pexels 背景 Firestorm Shuffle是分布式计算框架用来衔接上下游任务的数据重分布过程,在分布式计算中所有涉及到数据上下游衔接的过程都可以理解为shuffle。针对不同的分布式框架,shuffle有几种实现形态: 基于文件的pull based shuffle,如MapReduce、Spark。这种shuffle方式多用于类MR的框架,比如MapReduce、Spark,它的特点是具有较高的容错性,适合较大规模的批处理作业。由于实现的是基于文件的shuffle方案,因此失败
腾讯大数据
2021-11-19
3.1K
0
开箱即用,腾讯数据湖计算为海量数据分析赋能
hive
sql
私有网络
容器服务
serverless
导读 / Introduction 数据湖解决了海量异构数据的入湖和存储需求。通过对海量数据的分析挖掘,提升对数据的洞察,助力数字化决策,进而促进业务发展,是每个企业构建数据湖的根本目的所在。随着业务迭代的不断加速,企业对数据时效性和数据分析敏捷性提出了更高的要求。为此,腾讯云推出了数据湖计算(Data Lake Compute,DLC)。DLC采用存储和计算分离的架构,结合腾讯云对象存储COS和弹性容器服务EKS,打造了一个开箱即用、弹性扩展、按量付费的交互式分析服务。 图1 DLC架构图 高性
腾讯大数据
2021-05-13
1.4K
0
腾讯云副总裁刘煜宏:腾讯云原生产品每日调用次数已超百亿
运维
容器
kubernetes
云计算
serverless
前言 7月31日,腾讯云副总裁刘煜宏在2020云原生技术大会上表示:“腾讯云原生产品API每日调用量已经超过100亿次,拥有超过100万的开发者,同时服务超过50万的客户,腾讯云实际上已经成为国内服务开发者最多的云原生平台。” 因为能够极大的帮助企业降低云计算方面的部署成本和运维难度,云原生代表了云计算的下一重要方向。作为本次大会钻石供应商,腾讯云在云原生领域有着系统的布局和广泛的实践,并且基于对用户需求的把握,提供了目前国内最为完备的产品矩阵。 公有云方面,腾讯云围绕着Kubernetes、容器和
腾讯大数据
2020-08-06
1.5K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档