首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

gp 数据库

Greenplum(GP)数据库是一种高性能、可扩展的关系型分布式数据库管理系统(RDBMS),它基于开源的PostgreSQL数据库,并采用Massively Parallel Processing(MPP)架构。这种架构使得GP数据库能够在大规模数据集上进行并行处理,从而提供高性能的数据查询和分析能力。以下是关于Greenplum数据库的相关信息:

基础概念

  • 定义:Greenplum数据库,简称GP数据库,是一种基于PostgreSQL的关系型分布式数据库,专为大规模数据处理和分析而设计。
  • 架构:采用MPP架构,通过分布式存储和并行计算,实现高性能和可扩展性。

优势

  • 高性能:适合处理大规模数据集,提供快速的查询性能。
  • 高可扩展性:通过增加节点,可以线性扩展存储和计算能力。
  • 列式存储:提高数据压缩率和查询性能,特别适合于分析型查询。
  • 并行处理:将查询任务分配给多个节点并行执行,提高查询性能。
  • 广泛应用:适用于数据仓库、大数据分析、实时数据处理和业务智能等领域。

类型

GP数据库主要被视为一种列存储数据库和并行数据库,适用于大数据处理和复杂查询的场景。

应用场景

  • 企业级数据仓库:满足企业对数据仓库的运营需求,包括ETL、数据仓库架构、数据挖掘以及业务智能分析等。
  • 数据挖掘:在海量数据中进行数据挖掘、分析和探索,发现关键的信息。
  • 实时数据处理:对实时数据进行快速分析和响应,如实时用户行为分析、广告推荐和欺诈检测等。
  • 业务智能:与BI工具集成,支持企业进行数据驱动的决策,如销售数据分析、市场需求优化等。
页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

GP使用

gpcheckperf 检测 3、Segment 实例数量 1、考虑因素 1)、CPU核数 2)、物理内存 3)、网络速度 4)、主备实例同时工作 5)、服务器有运行其他进程 6)、预期的并发数 第二节数据库性能优化内容...禁用自动统计信息收集功能 3、数据膨胀 1)、膨胀原因 Greenplum 数据库使用多版本并发控制(MVCC)的储存机制,删除和刚更新的行仅是逻辑删除,其实实际数据仍然储存在表红,只是不可见。...2)、膨胀造成影响 - 占用磁盘储存空间 - 查询表时扫描更多的文件快,浪费IO资源 4、检测膨胀 HEAP表 select * from gp_toolkit.gp_bloat_expected_pages...SQL 查询分配的内存不足,数据库会创建溢出文件,默认值是100000, 0 表示无限制 gp_workfile_compress_algorithm 设置溢出的临时文件是否压缩 8、计算倾斜排查过程...根据节点服务器占用系统资源最大的进程,回溯查询到数据库进程 3、两段事务锁 1、问题案例 1)、执行删除表命令时,一直在执行中,链接数据库查询并没有锁 2)、永久不处理后,wal文件堆积 drop table

1.6K30
  • Snova运维篇(三):GP数据库备份和恢复

    本节主要从gp数据备份和恢复角度深入学习gp数据库。定期执行备份能确保在数据损坏或者系统失效发生时能恢复数据或者重建Greenplum数据库系统。...用户还可以使用备份从一个Greenplum数据库系统迁移数据到另一个。...不同系统配置数据库的恢复 确保数据库已经有完整的备份 包括Master的转储文件(gp_dump_-1_1_timestamp、gp_dump_-1_1_timestamp_post_data)以及每个...Segment实例一个的转储文件(例如gp_dump_0_2_timestamp、gp_dump_1_3_timestamp、gp_dump_2_4_timestamp等等) 确保要恢复的数据库已创建...-f /gpdb/backups/gp_dump_0_5_20160714_post_data 更新数据库序列 gunzip -c path_to_master_dump_directory/gp_dump

    2K10

    Snova运维篇(十):gp数据库中数据操作-2

    图片.png 目录: 定义数据库对象 管理数据 ---- 基本概念: 视图 在 SQL 中,视图是基于 SQL 语句的结果集的可视化的表。 视图包含行和列,就像一个真实的表。...视图中的字段就是来自一个或多个数据库中的真实的表中的字段。我们可以向视图添加 SQL 函数、WHERE 以及 JOIN 语句,我们也可以提交数据,就像这些来自于某个单一的表。...---- 1.定义数据库对象: (一)对大型表分区 Greenplum数据库支持: 范围分区:基于一个数字型范围划分数据,例如按照日期或价格划分。...komablog=# alter sequence myserial restart with 105; ALTER SEQUENCE 删除一个序列 DROP SEQUENCE myserial; (三)gp...RENAME TO old_table; CREATE INDEX myixcolumn_ix ON old_table; VACUUM ANALYZE old_table; 索引类型 Greenplum数据库数据库支持

    89330

    Snova运维篇(九):gp数据库中数据的基本操作-1

    本节主要从数据库中数据操作和管理的角度学习gp数据库。...图片.png 目录: 定义数据库对象 管理数据 装载和卸载数据 ---- 基本概念: 表空间 一个表空间是一个存储位置,其中底层的基础数据库的对象可以保留。...创建后,可以在创建数据库段时按名称引用表空间。表空间仅指定数据库的储存位置,不指定数据库结构或数据库架构。...cascade 删除操作时,自动删除依赖对象 ---- 1.定义数据库对象 (一)创建和管理数据库 模版数据库 不要在template1中创建任何对象,除非用户想要在每一个用户创建的数据库中都有那些对象...用户可以使用template0来创建一个只包含Greenplum数据库在初始化时预定义的标准对象且完全干净的数据库 创建一个数据库 => CREATE DATABASE new_dbname; 客户端创建

    2.4K10

    greenplum常用的gp_toolkit监控语句

    11、系统中常用查询的函数 gp_toolkit 说明 Greenplum数据库提供了一个名为gp_tooikit的管理schema,该schema下有关于查询系统目录,日志文件, 用户创建(databases...select * from gp_toolkit.gp_log_system; -- 该视图用一个外部表来读取在主机上的日志文件同时报告在数据库会话中SQL命令的执行时间 select * from...gp_toolkit.gp_log_command_timings; -- 该视图使用一个外部表来读取整个Greenplum系统(主机,段,镜像)的服务器日志文件和列出与当前数据库关联的日志的入口。...Segment主机上运行df(磁盘空闲)并且报告返回的结果 select * from gp_toolkit.gp_disk_free; -- 该视图显示数据库的总大小。...select * from gp_toolkit.gp_workfile_usage_per_segment; 8、查看用户创建的信息(数据库,schema,表,索引,函数,视图)等信息 -- gp

    2.8K61
    领券