presto regexp_like_regexp_like_regexp_like用法 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Presto介绍及常用查询优化方法总结

Presto提供了一套Connector接口，用于读取元信息和原始数据。 Presto 内置有多种数据源，如 Hive、MySQL、Kudu、Kafka 等。...小心使用内存和数据结构 GC控制无容错 2、Presto查询优化 2.1 存储优化 ① 合理设置分区与Hive类似，Presto会根据元信息读取分区数据，合理的分区能减少Presto数据读取量，提升查询性能...② 使用列式存储 Presto对ORC文件读取做了特定优化，因此在Hive中创建Presto使用的表时，建议采用ORC格式存储。相对于Parquet，Presto对ORC支持更好。...⑤ 用regexp_like代替多个like语句 Presto查询优化器没有对多个like语句进行优化，使用regexp_like对性能有较大提升 [GOOD] SELECT ......FROM access WHERE regexp_like(method, 'GET|POST|PUT|DELETE') [BAD] SELECT ...

2.6K0 0

Presto系列 | Presto基本介绍

233酱准备不定时持续更新这个系列，本文主要从Presto的使用举例，Presto的应用场景、Presto的基本概念三个部分来初步介绍Presto。...Presto的使用举例比如说，你想对存储在不同数据源中的数据，如HDFS、Mysql、HBase等通过一个SQL做查询分析，那么只需要把每一个数据源当成是Presto的Connector，对应实现Presto...Presto跑批的限制原因： ? Presto跑批的条件： ? 所以他们提供了Presto on Spark方案，这样做的好处是可以统一用户使用的SQL方言差异，UDF差异。 ?...Presto的基本概念前面主要谈了Presto的使用场景，下面简要从 Presto的架构和基本术语上介绍Presto。 Presto架构 Presto的架构图如下： ?...Coordinator Presto中的Coordinator节点负责解析SQL语句，生成并优化物理执行计划，管理Presto worker节点。它是Presto运行的“大脑”。

4.3K4 0

您找到你想要的搜索结果了吗？

是的

没有找到

大数据Presto（一）：Presto介绍

Presto介绍一、Presto出现背景Presto是Facebook在2012年开发的，是专为Hadoop打造的一款数据仓库工具。...2012年秋季，Facebook开发Presto，目前该项目在Facebook中运行超过30000个查询，每日处理数据PB以上。Presto的查询速度是Hive的5-10倍。...Presto官网地址：https://prestodb.io图片二、Presto特点多数据源Presto可以支持MySQL、PostgreSQL、cassandra、Hive、Kafka等多种数据源查询...但是Presto不支持存储过程，不适合大表Join操作，因为Presto是基于内存的，多张大表关联可能给内存带来压力。...Presto性能是Hive的10倍以上。

2.1K6 1

快速学习-Presto优化

第3章 Presto优化 3.1 数据存储 1）合理设置分区与Hive类似，Presto会根据元信息读取分区数据，合理的分区能减少Presto数据读取量，提升查询性能。...2）使用列式存储 Presto对ORC文件读取做了特定优化，因此在Hive中创建Presto使用的表时，建议采用ORC格式存储。相对于Parquet，Presto对ORC支持更好。...GOOD]: SELECT * FROM tbl ORDER BY time LIMIT 100 [BAD]: SELECT * FROM tbl ORDER BY time 5）使用近似聚合函数 Presto...SELECT approx_distinct(user_id) FROM access 6）用regexp_like代替多个like语句 Presto查询优化器没有对多个like语句进行优化，使用regexp_like...FROM access WHERE regexp_like(method, 'GET|POST|PUT|DELETE') [BAD] SELECT ...

1.9K2 0

Presto介绍与常用查询优化方法

Facebook称Presto的性能比Hive要好上10倍多。2013年Facebook正式宣布开源Presto。 Presto架构 ?...使用列式存储 Presto对ORC文件读取做了特定优化，因此在Hive中创建Presto使用的表时，建议采用ORC格式存储。相对于Parquet，Presto对ORC支持更好。...比如使用approx_distinct() 函数比Count(distinct x)有大概2.3%的误差用regexp_like代替多个like语句： Presto查询优化器没有对多个like语句进行优化...，使用regexp_like对性能有较大提升使用Join语句时将大表放在左边： Presto中join的默认算法是broadcast join，即将join左边的表分割到多个worker，然后将join...Impala性能稍领先于presto,但是presto在数据源支持上非常丰富，presto对SQL的支持上也更多一些。

3.4K5 0

Presto实战

一、Presto简介 1、PRESTO是什么？ Presto是一个开源的分布式SQL查询引擎，适用于交互式分析查询，数据量支持GB到PB字节。...二、Presto安装部署 1、下载presto tar包： https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.189/...如果在一个节点上安装多个Presto实例（例如：在同一台机器上安装多个Presto节点），那么每个Presto节点必须拥有唯一的node.id。...三、部署presto client 1、下载： https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.189/presto-cli...-0.189-executable.jar 上传linux服务器上，重命名为presto： $mv presto-cli-0.189-executable.jar presto $chmod a+x presto

2K2 0

大数据Presto（五）：Presto优化与Impala对比

Presto优化与Impala对比一、Presto优化1、数据存储一般Presto与Hive整合使用，针对这种使用情况有如下几点优化建议：合理设置分区合理设置分区在读取数据时可以针对分区数据读取...，可以减少Presto数据读取量，提升查询性能。...使用列式存储Presto对ORC文件读取做了特定优化，因此在Hive中创建Presto使用的表时，建议采用ORC格式存储。相对于Parquet，Presto对ORC支持更好。...使用Join语句时将大表放在左边使用Join语句时将大表放在左边Presto中join的默认算法是broadcast join，即将join左边的表分割到多个worker，然后将join右边的表数据整个复制一份发送到每个...二、Presto与Impala对比Impala性能比Presto相对来说要快一些，两者都对内存消耗比较大，虽然Impala速度快但是Presto支持的数据源丰富。

1.7K6 1

大数据Presto（二）：Presto安装搭建

Presto安装搭建一、Presto Server安装Presto的安装搭建可以参照官网：https://prestodb.io/docs/current/installation/deployment.html.../presto-server-0.259.tar.gz[root@node3 software]# mv presto-server-0.259 presto-0.2594、创建”data”目录在node3...presto[root@node3 presto-0.259]# chmod +x presto3、启动Presto cli 在node3上执行如下命令：[root@node3 ~]# cd /software.../presto-0.259/[root@node3 presto-0.259]# ....执行如下查询命令：#查看Hive中的库presto:default> show schemas;#查看表presto:default> show tables;#查询数据presto:default>

1.5K7 1

Presto统计信息

表统计 Presto支持基于统计的查询优化。为了使查询能够利用这些优化，Presto必须具有该查询中表的统计信息。表统计信息通过连接器提供给查询计划者。...Presto会根据查询中的过滤谓词，尝试选择由最少数量的分区组成的table layout。...可以使用SHOW STATS for命令通过Presto SQL界面显示表统计信息。 ?...每个计划片段均由单个或多个Presto节点执行。片段分离代表Presto节点之间的数据交换。片段类型指定Presto节点如何执行片段以及片段之间的数据分配方式. SINGLE 片段在单个节点上执行....使用VERBOSE选项时，将提供更详细的信息和低级别的统计信息；要了解这些内容，需要了解Presto内部和实现细节。可以看到每个阶段花费的CPU时间以及该阶段中每个计划节点的相对成本。

2.5K3 0

大数据Presto（三）：Presto Connector连接器

Presto Connector连接器Presto Connector支持从多种数据源读取数据，例如：Hive、MySQL、Redis、Kudu、Kafka等。.../presto --server node3:8080 --catalog mysql --schema presto_db#查询所有schema信息，就是mysql中所有的库信息presto:presto_db...“type”:指定presto中字段的类型，更多类型参照：Kafka Connector — Presto 0.277 Documentation以上Presto映射读取Kafka数据的配置文件需要在每台...3 --replication-factor 32.3、启动Presto集群，启动Presto客户端#启动Presto集群[root@node3 ~]# /software/presto-0.259/...-0.259/bin/launcher run#启动Presto客户端[root@node3 presto-0.259]# cd /software/presto-0.259[root@node3 presto

1.6K12 1

构建一个优秀的SQL及优化方案

使用近似聚合函数---大部分查询引擎或者分布式数据库(Presto, ClickHouse, Druid等)有一些近似聚合函数，对于允许有少量误差的查询场景，使用这些函数对查询性能有大幅提升。...避免使用多LIKE语句---如果是使用的Presto的话，一定要使用regexp_like，这是因为Presto查询优化器没有对多个like语句进行优化，使用regexp_like对性能有较大提升正确的...FROM tableA WHERE regexp_like(method, 'GET|POST|PUT|DELETE')错误的SQL：SELECT ......LIKE '%POST%' OR method LIKE '%PUT%' OR method LIKE '%DELETE%'JOIN避免大表再右侧---JOIN的默认算法是broadcast join(Presto...FROM tableL JOIN l tableS s ON l.id = s.id核心点就是使用分布式JOIN，Presto的这种配置类型会将左表和右表同时以join key的hash value为分区字段进行分区

8065 0

presto环境搭建

-0.191.tar.gz 下载路径：https://repo1.maven.org/maven2/com/facebook/presto/presto-server/0.191/presto-server...4、配置presto 在我们解压好的目录下创建一个etc文件夹，etc主要需要配置以下内容 Node Properties: environmental configuration specific...,下载链接为： https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.191/presto-cli-0.191-executable.jar...（3）下载下来后改个名字为presto,放在bin目录下，然后给个执行权限：chmod +x presto ，如下图 ?.../presto --server localhost:8080 --catalog hive --schema default （5）如果要关闭presto服务，执行：bin/launcher stop

1.7K1 0

presto timestmp使用

日期和时间运算符 📷 时区转化 SELECT timestamp '2012-10-31 01:00 UTC'; 2012-10-31 01:00:00.0...

8182 0

Presto查询引擎

附上: 喵了个咪的博客:w-blog.cn Presto文档 — Presto 0.100 Documentation 1.安装Presto ca /app/install wget https://repo1....maven.org/maven2/com/facebook/presto/presto-server/0.184/presto-server-0.184.tar.gz tar -zxvf presto-server...-0.184.tar.gz mv presto-server-0.184 /usr/local/presto-0.184 设置环境变量 vim /etc/profile # presto export...PRESTO=/usr/local/presto-0.184 export PATH=$PRESTO/bin:$PATH source /etc/profile 配置文件先进入到presto根目录下...-executable.jar mv presto-cli-0.184-executable.jar presto-cli chmod -R 777 presto-cli presto-cli --server

2K5 0

Presto连接Hive

-0.211/etc/cluster/core-site.xml,/opt/presto-server-0.211/etc/cluster/hdfs-site.xml 其中 hive.metastore.uri...hdfs 配置文件从 hdfs 的环境中复制 core-site.xml 和 hdfs-site.xml 文件到 presto 的 etc/cluster 目录下。...启动 Prestore 分别在两个节点上重新启动 Presto 服务。...查询数据 # 启动 presto 命令行 $ ..../presto --server bd1:8080 --catalog hive --schema test # 查询数据库 presto:test> show schemas from hive;

3.6K6 0

Presto连接MySQL

/presto/presto-server/0.211/presto-server-0.211.tar.gz tar zxvf presto-server-0.211.tar.gz cd /opt/presto-server...分别在两个节点上运行下面的启动命令 # 启动 Presto bin/launcher start # 停止 Presto bin/launcher stop # 前台运行 Presto，建议刚开始的时候使用这种方式...命令行工具 # 下载 wget -c https://repo1.maven.org/maven2/com/facebook/presto/presto-cli/0.211/presto-cli-0.211...-executable.jar # 这个jar文件是一个自运行的jar包，因此为了使用方便，我们可以将其改名为presto mv presto-cli-0.211-executable.jar presto...通过 Presto 操作 MySQL 数据库 .

2.7K4 0

快速学习-Presto简介

第1章 Presto简介 1.1 Presto概念 Presto是一个开源的分布式SQL查询引擎，适用于交互式分析查询，数据量支持GB到PB字节。...1.2 Presto应用场景 Presto支持在线数据查询，包括Hive，关系数据库（MySQL、Oracle）以及专有数据存储。...一条Presto查询可以将多个数据源的数据进行合并，可以跨越整个组织进行分析。 Presto主要用来处理响应时间小于1秒到几分钟的场景。...1.3 Presto架构 Presto是一个运行在多台服务器上的分布式系统。完整安装包括一个Coordinator和多个Worker。...1.5 Presto优缺点 Presto中SQL运行过程：MapReduce vs Presto ? 使用内存计算，减少与硬盘交互。

1.8K3 0

Centos 6.9 配置 Presto

配置 presto client # 把客户端jar包放置在presto-server-0.166/bin目录下 mv presto-cli-0.166-executable.jar presto-server...-0.166/bin # 修改客户端jar包名为presto mv presto-cli-0.166-executable.jar presto # 修改presto客户端jar包权限 chmod +x...presto 9....把 presto 添加到环境变量中 (~/.bash_profile) export PRESTO_HOME=/opt/presto-server-0.166 export PATH=$PRESTO_HOME...验证 presto 是否启动查看Presto Web UI http://bigdata:8080 启动 Presto 客户端 presto --server bigdata:8080 --catalog

8963 0

Presto SPI概述

连接器是Presto中所有查询数据的来源：它们支持Presto可用的每个目录 SPI代码可在根目录的presto-spi目录中找到。...此类的名称是通过标准Java ServiceLoader接口提供给Presto的：类路径包含META-INF/services目录中名为com.facebook.presto.spi.Plugin的资源文件...该文件的内容是一行，列出了插件类的名称. com.facebook.presto.example.ExamplePlugin 对于Presto源代码中包含的内置插件，只要插件的pom.xml文件包含以下行...，就会创建此资源文件 presto-plugin 插件对于希望了解Presto SPI的开发人员而言，Plugin接口是一个很好的起点。...例如，getConnectorFactories（）方法是一个顶层函数，当Presto准备好创建连接器实例以支持目录时，Presto会调用该函数来检索ConnectorFactory。

1.5K1 0

Presto Web UI

概述每个 Presto 服务都会提供一个 Web 界面，通常称为 Presto Web UI。可以使用与 Presto 服务器相同地址和 HTTP 端口号来访问 Presto Web UI。...Presto Web UI 可在每个 Presto 的 Coordinator 上访问，并可用于检查和监控 Presto 集群以及已处理的查询。...当你第一次使用 Presto Web UI 时，你会看到如下图所示的页面。顶部展示了 Presto 的集群信息，底部展示了查询列表。...提交查询来源也可以不是 presto-cli，例如，当应用程序使用 JDBC 驱动程序连接到 Presto 时，提交查询来源会显示为 presto-jdbc。...翻译来自《Presto权威指南》

5.9K2 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭