Presto_presto orc_云 Presto - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Presto系列 | Presto基本介绍

233酱准备不定时持续更新这个系列，本文主要从Presto的使用举例，Presto的应用场景、Presto的基本概念三个部分来初步介绍Presto。...Presto的使用举例比如说，你想对存储在不同数据源中的数据，如HDFS、Mysql、HBase等通过一个SQL做查询分析，那么只需要把每一个数据源当成是Presto的Connector，对应实现Presto...Presto跑批的限制原因： ? Presto跑批的条件： ? 所以他们提供了Presto on Spark方案，这样做的好处是可以统一用户使用的SQL方言差异，UDF差异。 ?...Presto的基本概念前面主要谈了Presto的使用场景，下面简要从 Presto的架构和基本术语上介绍Presto。 Presto架构 Presto的架构图如下： ?...Coordinator Presto中的Coordinator节点负责解析SQL语句，生成并优化物理执行计划，管理Presto worker节点。它是Presto运行的“大脑”。

4.2K4 0

大数据Presto（一）：Presto介绍

Presto介绍一、Presto出现背景Presto是Facebook在2012年开发的，是专为Hadoop打造的一款数据仓库工具。...2012年秋季，Facebook开发Presto，目前该项目在Facebook中运行超过30000个查询，每日处理数据PB以上。Presto的查询速度是Hive的5-10倍。...Presto官网地址：https://prestodb.io图片二、Presto特点多数据源Presto可以支持MySQL、PostgreSQL、cassandra、Hive、Kafka等多种数据源查询...但是Presto不支持存储过程，不适合大表Join操作，因为Presto是基于内存的，多张大表关联可能给内存带来压力。...Presto性能是Hive的10倍以上。

2K6 1

您找到你想要的搜索结果了吗？

是的

没有找到

Presto实战

一、Presto简介 1、PRESTO是什么？ Presto是一个开源的分布式SQL查询引擎，适用于交互式分析查询，数据量支持GB到PB字节。...二、Presto安装部署 1、下载presto tar包： https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.189/...如果在一个节点上安装多个Presto实例（例如：在同一台机器上安装多个Presto节点），那么每个Presto节点必须拥有唯一的node.id。...三、部署presto client 1、下载： https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.189/presto-cli...-0.189-executable.jar 上传linux服务器上，重命名为presto： $mv presto-cli-0.189-executable.jar presto $chmod a+x presto

1.9K2 0

大数据Presto（五）：Presto优化与Impala对比

Presto优化与Impala对比一、Presto优化1、数据存储一般Presto与Hive整合使用，针对这种使用情况有如下几点优化建议：合理设置分区合理设置分区在读取数据时可以针对分区数据读取...，可以减少Presto数据读取量，提升查询性能。...使用列式存储Presto对ORC文件读取做了特定优化，因此在Hive中创建Presto使用的表时，建议采用ORC格式存储。相对于Parquet，Presto对ORC支持更好。...使用Join语句时将大表放在左边使用Join语句时将大表放在左边Presto中join的默认算法是broadcast join，即将join左边的表分割到多个worker，然后将join右边的表数据整个复制一份发送到每个...二、Presto与Impala对比Impala性能比Presto相对来说要快一些，两者都对内存消耗比较大，虽然Impala速度快但是Presto支持的数据源丰富。

1.6K6 1

大数据Presto（二）：Presto安装搭建

Presto安装搭建一、Presto Server安装Presto的安装搭建可以参照官网：https://prestodb.io/docs/current/installation/deployment.html.../presto-server-0.259.tar.gz[root@node3 software]# mv presto-server-0.259 presto-0.2594、创建”data”目录在node3...presto[root@node3 presto-0.259]# chmod +x presto3、启动Presto cli 在node3上执行如下命令：[root@node3 ~]# cd /software.../presto-0.259/[root@node3 presto-0.259]# ....执行如下查询命令：#查看Hive中的库presto:default> show schemas;#查看表presto:default> show tables;#查询数据presto:default>

1.4K7 1

Presto统计信息

表统计 Presto支持基于统计的查询优化。为了使查询能够利用这些优化，Presto必须具有该查询中表的统计信息。表统计信息通过连接器提供给查询计划者。...Presto会根据查询中的过滤谓词，尝试选择由最少数量的分区组成的table layout。...可以使用SHOW STATS for命令通过Presto SQL界面显示表统计信息。 ?...每个计划片段均由单个或多个Presto节点执行。片段分离代表Presto节点之间的数据交换。片段类型指定Presto节点如何执行片段以及片段之间的数据分配方式. SINGLE 片段在单个节点上执行....使用VERBOSE选项时，将提供更详细的信息和低级别的统计信息；要了解这些内容，需要了解Presto内部和实现细节。可以看到每个阶段花费的CPU时间以及该阶段中每个计划节点的相对成本。

2.5K3 0

大数据Presto（三）：Presto Connector连接器

Presto Connector连接器Presto Connector支持从多种数据源读取数据，例如：Hive、MySQL、Redis、Kudu、Kafka等。.../presto --server node3:8080 --catalog mysql --schema presto_db#查询所有schema信息，就是mysql中所有的库信息presto:presto_db...“type”:指定presto中字段的类型，更多类型参照：Kafka Connector — Presto 0.277 Documentation以上Presto映射读取Kafka数据的配置文件需要在每台...3 --replication-factor 32.3、启动Presto集群，启动Presto客户端#启动Presto集群[root@node3 ~]# /software/presto-0.259/...-0.259/bin/launcher run#启动Presto客户端[root@node3 presto-0.259]# cd /software/presto-0.259[root@node3 presto

1.5K12 1

presto环境搭建

-0.191.tar.gz 下载路径：https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.191/presto-server...4、配置presto 在我们解压好的目录下创建一个etc文件夹，etc主要需要配置以下内容 Node Properties: environmental configuration specific...,下载链接为： https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.191/presto-cli-0.191-executable.jar...（3）下载下来后改个名字为presto,放在bin目录下，然后给个执行权限：chmod +x presto ，如下图 ?.../presto --server localhost:8080 --catalog hive --schema default （5）如果要关闭presto服务，执行：bin/launcher stop

1.7K1 0

Presto连接MySQL

/presto/presto-server/0.211/presto-server-0.211.tar.gz tar zxvf presto-server-0.211.tar.gz cd /opt/presto-server...分别在两个节点上运行下面的启动命令 # 启动 Presto bin/launcher start # 停止 Presto bin/launcher stop # 前台运行 Presto，建议刚开始的时候使用这种方式...命令行工具 # 下载 wget -c https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.211/presto-cli-0.211...-executable.jar # 这个jar文件是一个自运行的jar包，因此为了使用方便，我们可以将其改名为presto mv presto-cli-0.211-executable.jar presto...通过 Presto 操作 MySQL 数据库 .

2.7K4 0

presto timestmp使用

日期和时间运算符 📷 时区转化 SELECT timestamp '2012-10-31 01:00 UTC'; 2012-10-31 01:00:00.0...

7962 0

Presto连接Hive

-0.211/etc/cluster/core-site.xml,/opt/presto-server-0.211/etc/cluster/hdfs-site.xml 其中 hive.metastore.uri...hdfs 配置文件从 hdfs 的环境中复制 core-site.xml 和 hdfs-site.xml 文件到 presto 的 etc/cluster 目录下。...启动 Prestore 分别在两个节点上重新启动 Presto 服务。...查询数据 # 启动 presto 命令行 $ ..../presto --server bd1:8080 --catalog hive --schema test # 查询数据库 presto:test> show schemas from hive;

3.6K6 0

Presto查询引擎

附上: 喵了个咪的博客:w-blog.cn Presto文档 — Presto 0.100 Documentation 1.安装Presto ca /app/install wget https://repo1....maven.org/maven2/com/facebook/presto/presto-server/0.184/presto-server-0.184.tar.gz tar -zxvf presto-server...-0.184.tar.gz mv presto-server-0.184 /usr/local/presto-0.184 设置环境变量 vim /etc/profile # presto export...PRESTO=/usr/local/presto-0.184 export PATH=$PRESTO/bin:$PATH source /etc/profile 配置文件先进入到presto根目录下...-executable.jar mv presto-cli-0.184-executable.jar presto-cli chmod -R 777 presto-cli presto-cli --server

1.9K5 0

快速学习-Presto优化

第3章 Presto优化 3.1 数据存储 1）合理设置分区与Hive类似，Presto会根据元信息读取分区数据，合理的分区能减少Presto数据读取量，提升查询性能。...2）使用列式存储 Presto对ORC文件读取做了特定优化，因此在Hive中创建Presto使用的表时，建议采用ORC格式存储。相对于Parquet，Presto对ORC支持更好。...GOOD]: SELECT * FROM tbl ORDER BY time LIMIT 100 [BAD]: SELECT * FROM tbl ORDER BY time 5）使用近似聚合函数 Presto...OR method LIKE '%POST%' OR method LIKE '%PUT%' OR method LIKE '%DELETE%' 7）使用Join语句时将大表放在左边 Presto...3.4 注意事项 ORC和Parquet都支持列式存储，但是ORC对Presto支持更好（Parquet对Impala支持更好）对于列式存储而言，存储文件为二进制的，对于经常增删字段的表，建议不要使用列式存储

1.9K2 0

Centos 6.9 配置 Presto

配置 presto client # 把客户端jar包放置在presto-server-0.166/bin目录下 mv presto-cli-0.166-executable.jar presto-server...-0.166/bin # 修改客户端jar包名为presto mv presto-cli-0.166-executable.jar presto # 修改presto客户端jar包权限 chmod +x...presto 9....把 presto 添加到环境变量中 (~/.bash_profile) export PRESTO_HOME=/opt/presto-server-0.166 export PATH=$PRESTO_HOME...验证 presto 是否启动查看Presto Web UI http://bigdata:8080 启动 Presto 客户端 presto --server bigdata:8080 --catalog

8873 0

快速学习-Presto简介

第1章 Presto简介 1.1 Presto概念 Presto是一个开源的分布式SQL查询引擎，适用于交互式分析查询，数据量支持GB到PB字节。...1.2 Presto应用场景 Presto支持在线数据查询，包括Hive，关系数据库（MySQL、Oracle）以及专有数据存储。...一条Presto查询可以将多个数据源的数据进行合并，可以跨越整个组织进行分析。 Presto主要用来处理响应时间小于1秒到几分钟的场景。...1.3 Presto架构 Presto是一个运行在多台服务器上的分布式系统。完整安装包括一个Coordinator和多个Worker。...1.5 Presto优缺点 Presto中SQL运行过程：MapReduce vs Presto ? 使用内存计算，减少与硬盘交互。

1.8K3 0

Presto Web UI

概述每个 Presto 服务都会提供一个 Web 界面，通常称为 Presto Web UI。可以使用与 Presto 服务器相同地址和 HTTP 端口号来访问 Presto Web UI。...Presto Web UI 可在每个 Presto 的 Coordinator 上访问，并可用于检查和监控 Presto 集群以及已处理的查询。...当你第一次使用 Presto Web UI 时，你会看到如下图所示的页面。顶部展示了 Presto 的集群信息，底部展示了查询列表。...提交查询来源也可以不是 presto-cli，例如，当应用程序使用 JDBC 驱动程序连接到 Presto 时，提交查询来源会显示为 presto-jdbc。...翻译来自《Presto权威指南》

5.8K2 1

Presto SPI概述

连接器是Presto中所有查询数据的来源：它们支持Presto可用的每个目录 SPI代码可在根目录的presto-spi目录中找到。...此类的名称是通过标准Java ServiceLoader接口提供给Presto的：类路径包含META-INF/services目录中名为com.facebook.presto.spi.Plugin的资源文件...该文件的内容是一行，列出了插件类的名称. com.facebook.presto.example.ExamplePlugin 对于Presto源代码中包含的内置插件，只要插件的pom.xml文件包含以下行...，就会创建此资源文件 presto-plugin 插件对于希望了解Presto SPI的开发人员而言，Plugin接口是一个很好的起点。...例如，getConnectorFactories（）方法是一个顶层函数，当Presto准备好创建连接器实例以支持目录时，Presto会调用该函数来检索ConnectorFactory。

1.5K1 0

Presto集群部署

而基于内存查询的分布式查询引擎--Presto正是其中之一。很多人都说现代计算机技术的发展都是拼开源，拼社区。而Presto的社区也不小，国际化的Facebook，也有国内电商大头京东。...Presto集群部署架构图 2.安装步骤 step1:系统环境准备： 1）JDK8 2）Hadoop2.x step2:软件准备 presto-server-0.191.tar.gz 下载地址：https...://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.191/presto-server-0.191.tar.gz $ wget http...=/opt/prestodb $PRESTO_INSTALL_HOME下面新建2个目录： presto_data presto_server step4:在presto_server添加配置文件 $mkdir.../presto-cli/0.191/presto-cli-0.191-executable.jar step2:连接服务 $ ln -s presto-cli-xxx.jar presto $ .

1.3K3 0

Presto Event Listener开发

简介同Hive Hook一样，Presto也支持自定义实现Event Listener，用于侦听Presto引擎执行查询时发生的事件，并作出相应的处理。...部署，放到Presto指定目录，修改配置文件。...Maven Pom com.facebook.presto presto-spi</artifactId...使用服务提供者接口（SPI）来扩展Presto。...=presto jdbc.pwd=presto123 在presto根目录下创建query-event-listener目录，名称与我们上面event listener的name一致将我们的jar包和

1.1K3 0

为什么要使用Presto

让 Presto 来解救 Presto 能够解决上面所有问题，并能够带来更多的能力：通过联邦查询查询不同的系统，并行查询，水平集群扩展等等。如下图所示是 Presto 的 logo。...即使 Presto 可以理解并有效执行 SQL，但 Presto 也不是数据库，因为它不包括自己的数据存储系统。...使用 Presto 时，存储和计算是分离的，可以独立扩展。Presto 代表计算层，而底层数据源代表存储层。这样，Presto 可以根据对访问数据的分析需求来扩展和缩减其计算资源以进行查询处理。...Presto 使用场景 Presto 的灵活性和强大功能让户可以自己决定使用 Presto 的程度。对于一个特定的问题，只能从一个小的用途开始。大多数 Presto 用户都是这样开始的。...Presto 可以帮你解决以上所有问题。你可以在 Presto 中访问所有数据库。你可以使用 Presto 支持的标准 SQL、函数、各种操作符查询不同系统。

2.3K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭