PRESTO-分布式大数据SQL查询引擎

http://prestodb-china.com/

PRESTO是什么?

Presto是一个开源的分布式SQL查询引擎,适用于交互式分析查询,数据量支持GB到PB字节。

Presto的设计和编写完全是为了解决像Facebook这样规模的商业数据仓库的交互式分析和处理速度的问题。

它可以做什么?

Presto支持在线数据查询,包括Hive, Cassandra, 关系数据库以及专有数据存储。 一条Presto查询可以将多个数据源的数据进行合并,可以跨越整个组织进行分析。

Presto以分析师的需求作为目标,他们期望响应时间小于1秒到几分钟。 Presto终结了数据分析的两难选择,要么使用速度快的昂贵的商业方案,要么使用消耗大量硬件的慢速的“免费”方案。

谁在使用它?

Facebook使用Presto进行交互式查询,用于多个内部数据存储,包括300PB的数据仓库。 每天有1000多名Facebook员工使用Presto,执行查询次数超过30000次,扫描数据总量超过1PB。

领先的互联网公司包括Airbnb和Dropbox都在使用Presto。

Presto令人吃惊。 首席工程师Andy Kramolisch刚在生产环境使用了几天。 在大多数情况下它比Hive快几个数量级。 与Redshift不同,它直接从HDFS读取数据,在使用前不需要大量的ETL操作,就可以工作。

Christopher Gutierrez, 在线分析经理, Airbnb 我们对Presto感到非常兴奋。 我们打算用它快速获取用户使用Dropbox的不同方式,以及诊断他们遇到的问题。 在我们目前的测试中,它应用于某些最重要的特别用例,它表现稳定并且非常快。

Fred Wulff, 软件工程师, Dropbox

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏无原型不设计

普通程序员该如何进阶为全栈工程师?

如何成为一名全栈工程师(full stack developer)?互联网最热的话题之一。LinkedIn, Facebook上标榜自己是全栈工程师的人也越来...

79450
来自专栏喔家ArchiSelf

IoT中的高音质音频设计

音频是许多物联网应用不可或缺的组成部分, 包括消费品(如扬声器、耳机、可穿戴设备),医疗设备(如助听器),自动化工业控制应用、娱乐系统和汽车的信息娱乐设备等。

15240
来自专栏Sign

平行世界生成器

上次发了篇dolo的最新进度,大意就是『DOLO的核心玩法我又又又改了,下次应该不会再改了……』发完后看了眼,发现碎碎念太多了,所以就删了。 这次没啥可发的,就...

38660
来自专栏程序员互动联盟

要想学会Kali linux事先需要掌握哪些知识?

算起来在linux上开发程序差不多有十几年的时间了,接触linux是从一本杂志上看到的,说到了linux系统如何的高效安全,于是在千方百计的搞了个linux系统...

76120
来自专栏腾讯云技术沙龙

干货满满,腾讯云+社区技术沙龙 Kafka Meetup 深圳站圆满结束

2010年,LinkedIn 着手开发 Kafka,到2011年 Kafka 进入 Apache 孵化器,成为世界顶级开源项目,并迅速被各种企业采用。据分析,目...

5.4K1860
来自专栏媒矿工厂

5G时代的媒体远程生产

媒体应用需要巨大的网络容量来实现高带宽的流传输,对资源要求苛刻。5G的出现激发了新的解决方案和工具的研究和开发,可以满足媒体行业对网络链路的需求,随时随地提供特...

68820
来自专栏软件测试经验与教训

测试人员如何避免背黑锅?

29850
来自专栏大数据和云计算技术

大数据和云计算技术周报(第51期)

“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。

15030
来自专栏java一日一条

为什么我要写自己的框架?

其实说白了框架就是使用别人造好的轮子。在软件开发里面就是command+C/command+V。

13610
来自专栏企鹅号快讯

微信又更新了,这次放出年度大招!新变化让不少人拍手叫好!

昨天,微信放出年底大招, 做出了一波变化不小的更新! 对于这次的更新, 不少人在朋友圈拍手叫好。 ? 下面我们就来具体讲讲这次的小程序更新了什么功能: 1、可以...

25470

扫码关注云+社区

领取腾讯云代金券