腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
互联网技术栈
专栏成员
举报
93
文章
180541
阅读量
43
订阅数
订阅专栏
申请加入专栏
全部文章(93)
其他(38)
http(8)
存储(7)
分布式(7)
负载均衡(5)
java(5)
架构设计(5)
数据库(4)
云数据库 Redis(4)
git(4)
nginx(4)
开源(4)
安全(4)
系统架构(4)
云数据库 SQL Server(3)
dubbo(3)
json(2)
sql(2)
编程算法(2)
hive(2)
zookeeper(2)
tcp/ip(2)
rpc(2)
大数据(2)
数据分析(2)
微服务(2)
Elasticsearch Service(2)
官方文档(1)
机器学习(1)
python(1)
javascript(1)
go(1)
.net(1)
react(1)
html(1)
qt(1)
嵌入式(1)
apache(1)
容器镜像服务(1)
spring(1)
TDSQL MySQL 版(1)
消息队列 CMQ 版(1)
混合云存储(1)
日志数据(1)
容器(1)
缓存(1)
运维(1)
数据迁移(1)
网络安全(1)
hadoop(1)
jvm(1)
mybatis(1)
dns(1)
spring boot(1)
ftp(1)
单元测试(1)
udp(1)
rabbitmq(1)
spring cloud(1)
https(1)
hbase(1)
mqtt(1)
kafka(1)
搜索文章
搜索
搜索
关闭
大数据实时查询-Presto集群部署搭建
大数据
分布式
sql
数据分析
hive
Presto是一个分布式SQL查询引擎, 它被设计为用来专门进行高速、实时的数据分析。它支持标准的ANSI SQL,包括复杂查询、聚合(aggregation)、连接(join)和窗口函数(window functions)。Presto的运行模型和Hive或MapReduce有着本质的区别。Hive将查询翻译成多阶段的MapReduce任务, 一个接着一个地运行。 每一个任务从磁盘上读取输入数据并且将中间结果输出到磁盘上。 然而Presto引擎没有使用MapReduce。它使用了一个定制的查询和执行引擎和响应的操作符来支持SQL的语法。除了改进的调度算法之外, 所有的数据处理都是在内存中进行的。 不同的处理端通过网络组成处理的流水线。 这样会避免不必要的磁盘读写和额外的延迟。 这种流水线式的执行模型会在同一时间运行多个数据处理段, 一旦数据可用的时候就会将数据从一个处理段传入到下一个处理段。 这样的方式会大大的减少各种查询的端到端响应时间。
高广超
2018-12-12
3.5K
0
程序员技能图谱分享--极客时间
安全
大数据
机器学习
嵌入式
运维
安全工程师篇 程序开发语言 大数据技能图谱 机器学习技能图谱 架构师技能图谱 前端工程师篇 嵌入式开发必备技能 移动性能优化 云计算工程师篇 运维工程师篇 DBA 技能图谱 H5技能图谱 Hadoop
高广超
2018-12-12
1.4K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档