Pivotal Greenplum 5.9 特性简介

Pivotal Greenplum 5.9 于2018年6月20日正式发布,让我们通过这篇文章带你走进5.9的新特性。

Greenplum 5.9介绍

Pivotal的Greenplum是基于MPP架构的数据库产品,它可以满足下一代大数据仓库和大规模的分析任务的需求。通过自动对数据进行分区以及多节点并行执行查询等方式,它使一个包含上百节点的数据库集群运行起来就像单机版本的传统数据库一样简单可靠,同时提供了几十倍甚至上百倍的性能提升。除了传统的SQL,Greenplum还支持MapReduce,文本索引,存储过程等很多分析工具,所支持的数据量可以从上百GB到几百TB。

Greenplum 5.9.0可以从这里下载(https://network.pivotal.io/),文档在这里(https://gpdb.docs.pivotal.io/590/main/index.html),主页在这里(http://greenplum.org/),源代码在github(https://github.com/greenplum-db/gpdb)。

新特性支持

gpcopy:Greenplum集群间的高速数据迁移工具

5.9中包含了新的Greenplum数据迁移工具,可以用gpcopy完成以下任务:

通过--full进行全量备份,包括表,索引,视图,用户,资源队列等

复制指定的表或数据库到目标数据库

通过--schema-only 只复制元数据

gpcopy更多的信息可以参考它的文档(https://gpdb.docs.pivotal.io/590/utility_guide/admin_utilities/gpcopy.html)

备份恢复功能的增强

Gprestore可以通过不同的参数恢复如下数据库对象:

--metadata-only:只从备份中恢复元数据,表和视图不做恢复

--data-only:只从备份中恢复数据,表需要事先创建好;gprestore不再执行创建表的工作

--jobs:定义同时运行的任务的数目,增加这个参数的大小可以提高备份和恢复的速度

通过gpbackup和gprestore的--include-table 和--include-table-file 参数,可以同时备份视图和序列。

gpbackup和gprestore的文档可以参考这里:

gpbackup:https://gpdb.docs.pivotal.io/590/utility_guide/admin_utilities/gpbackup.html

gprestore

https://gpdb.docs.pivotal.io/590/utility_guide/admin_utilities/gprestore.html

Pl/Container资源管理功能增强

在5.9中,可以通过设置的方式,以用户为单位进行CPU资源的控制。老版本中只能以模块级别控制CPU使用。

为资源队列预留CPU资源

Greenplum 5.9中可以通过资源队列预留CPU资源,可以保证将CPU留给特定的查询来保证其查询速度。

试验特性

Pivotal Greenplum是基于开源的greenplum-db(https://github.com/greenplum-db/gpdb)发布的,它包含了正在开发中的很多激动人心的功能,任何针对这些功能的反馈都会推进我们改进相关功能,并在将来的版本中正式支持。Greenplum 5.9.0中有如下实验功能:

gpbackup和gprestore支持存储插件

DD Boost 存储插件:通过--plugin-config 参数可以指定将数据备份到Dell EMC Data Domain 存储方案上,或者从其上面恢复数据

S3存储插件:通过--plugin-config 参数可以指定将数据备份到Amazon的S3存储方案上,或者从其上面恢复数据

存储框架API:合作伙伴,用户和开源社区可以根据API 来支持自己的备份和恢复方案.

更多的信息可以参考文档 Using gpbackup Storage Plugins(https://gpdb.docs.pivotal.io/590/admin_guide/managing/backup-plugins.html )以及Backup/Restore Storage Plugin API(https://gpdb.docs.pivotal.io/590/admin_guide/managing/backup-plugin-api.html)。

Pivotal的Greenplum-Informatica Connector

新的 Pivotal Greenplum-Informatica Connector提供了稳定高速的Greenplum到Informatica的连接接口,支持Informatica Powercenter和Informatica Cloud等数据管理产品。详细信息可以参考文档 Pivotal Greenplum-Informatica Connector (Experimental) Documentation(https://greenplum-informatica.docs.pivotal.io/100/index.html)。

Recursive CTE

CTE(Common Table Expressin)定义了一个可以在同一个查询里重复使用的临时表,可以大大简化SQL语句。Greenplum 5.1.0中CTE定义支持了recursive关键字,从而允许在CTE定义时可以递归的引用自己。

SUSE平台上基于Resource group的资源管理

由于内核版本限制,SUSE11上的cgroup无法提供Resource group运行所依赖的功能,SUSE12解决了启用cgroup以后引起的Greenplum性能问题。

改变的功能

为了提供性能,当不是执行全量备份或恢复时,gpbackcup不再在最后的报告中打印总的数据库大小

为了兼容4.3的外部表,gprestore在恢复是会设置gp_ignore_error_table 服务端参数。这个参数允许5.x中兼容老版本的error table语法。关于参数的详细信息可以参考这里 gp_ignore_error_table(https://gpdb.docs.pivotal.io/590/ref_guide/config_params/guc-list.html#gp_ignore_error_table)。

改变了备份/恢复工具的存储插件API,具体信息可以参考这里实验特性。

Informatica Connector使用的Greenplum Streaming Server (GPSS) component升级到1.0.2,修复了部分bug,详细些信息参看文档 Pivotal Greenplum-Informatica Connector(http://greenplum-informatica.docs.pivotal.io/100/index.html )。

Greenplum 5.9.0将 PgBouncer 升级到1.8.1. PgBouncer 1.8.1 支持原生 TLS 加密,PAM 支以及 pg_hba.conf 兼容的权限配置. 详细信息可以参考文档Using the PgBouncer Connection Pooler (https://gpdb.docs.pivotal.io/590/admin_guide/access_db/topics/pgbouncer.html)。

Greenplum 5.9支持的GPCC版本升级为4.2,它可以支持查询计划的动态实时更新。

移除的功能

数据库的gp_unix_socket_directory 参数被标记为废弃,在之后的版本中会被移除

与开源版的比较

商业版的Greenpum除了包含了开源版本的全部功能,此外还有以下增强的功能:

打包安装及部署脚本

支持了QuickLZ压缩算法

图形界面的管理工具,Greenplum Commander Center

内置的监控工具,Workload Manager

基于SQL的文本检索引擎,GPText

Spark Connector 和 Gemfire Connector

DataDirect的ODBC和JDBC驱动

Pivotal的Greenplum暂不支持如下的社区模块

The PXF JDBC connector.

The PXF Apache Ignite connector.

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180626G0XWZG00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券