首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

HAWQ技术解析(十五) —— 备份恢复

pg_dump是一个从PostgreSQL继承的非并行应用。除此之外,有些情况下还需要从ETL过程备份原始数据。用户可以根据自己的实际场景选择适当的备份/恢复方法。...装载完成后,运行ANALYZE命令,保证基于最新的表统计信息生成优化的查询计划。...ETL程序提供了选择在本地还是HDFS存储备份文件的灵活性。 4. 备份方法对比         表1汇总了上面讨论的四种备份方法的区别。...当gpfdist用于可写外部表时,它并行接收HAWQ segment的输出流并写出到一个文件中。         为了使用gpfdist,在要还原备份文件的主机上启动gpfdist服务器程序。...由于gpfdist程序是一个web服务器,可以从HAWQ集群的每个主机(master或segment节点)运行类似下面的命令测试连接: $ wget http://gpfdist_hostname:port

2.1K90

PostgreSQL 15 16 小版本更新信息小结 版本更新是不是挤牙膏

https://www.postgresql.org/docs/release/15.0/ 15.0 提高在 work_mem 内存不足后的排序性能 https://www.postgresql.org...PG16 对ORDER BY或DISTINCT的聚合添加使用预排序数据的能力 PG16 允许将不可为空的输入作为内部关系来执行反连接,允许FULL和内部右OUTER哈希连接的并行化 https://www.postgresql.org...PG16 autovacuum 运行中影响性能后,调节延迟参数生效性的改变 Allow autovacuum to more frequently honor changes to delay settings...PG16 增加了LZ4和zstd压缩的方式在 pg_dump和pg_basebackup Improve pg_dump to accept a more consistent compression...during ALTER TABLE ADD COLUMN on a complex inheritance tree (Tender Wang) 16.2 在备用服务器中在子事务期间错误处理死元组

34410
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    GitLab安装与基础使用

    [TOC] 0x00 前言 在开源世界中,是没有终结的尽头! 描述:GitLab 是一个非常优秀的项目。这是一个开源项目,允许用户在自己的服务器上运行类似于 GitHub 的项目管理系统。...gitlab.rb and gitlab-secrets.json包含敏感数据,采用上面备份的形式不能将它们进行备份,只能通过手动备份的方式; 远程备份 描述:实际上就是在gitlab服务器上添加备份服务器的...在同一台Centos7机器上卸载了旧版本的gitlab后,接着又重新安装新版本的gitlab-ce 在安装完后修改配置,初始化配置时出现以下错误: Running handlers: There was....修改配置文件添加最后两行egrep -v "^#|^ 连接上后找到对应的identities表修改对应的字段,其实就是把字段中的user_id修改掉,我这里做法就是把用户的user_id改成了负数,这样在...Ldap认证时就找不到了,从而走标准认证(这是在不重启Gitlab的情况下进行)。

    8.5K20

    数据库PostrageSQL-备份和恢复

    SQL转储 SQL 转储方法的思想是创建一个由SQL命令组成的文件,当把这个文件回馈给服务器时,服务器将利用其中的SQL命令重建与转储时状态一样的数据库。...pg_dump对于其他备份方法的一个重要优势是,pg_dump的输出可以很容易地在新版本的PostgreSQL中载入,而文件级备份和连续归档都是极度的服务器版本限定的。...pg_dump也是唯一可以将一个数据库传送到一个不同机器架构上的方法,例如从一个32位服务器到一个64位服务器。...你也许希望在遇到一个SQL错误后让psql退出,那么可以设置ON_ERROR_STOP变量来运行psql,这将使psql在遇到SQL错误后退出并返回状态3: psql --set ON_ERROR_STOP...在使用这种模式时,注意即使是很小的一个错误也会导致运行了数小时的恢复被回滚。但是,这仍然比在一个部分恢复后手工清理复杂的数据库要更好。

    2.1K10

    企业自建GitLab代码仓库安装与基础配置使用

    0x00 前言 在开源世界中,是没有终结的尽头! 描述:GitLab 是一个非常优秀的项目。这是一个开源项目,允许用户在自己的服务器上运行类似于 GitHub 的项目管理系统。...gitlab.rb and gitlab-secrets.json包含敏感数据,采用上面备份的形式不能将它们进行备份,只能通过手动备份的方式; 远程备份 描述:实际上就是在gitlab服务器上添加备份服务器的...Centos7机器上卸载了旧版本的gitlab后,接着又重新安装新版本的gitlab-ce 在安装完后修改配置,初始化配置时出现以下错误: Running handlers: There was an...解决方法:卸载完旧版本后,记得删除旧的安装数据配置文件,安装目录,数据目录等,重新安装新版的gitlab-ce即可正常启动。...,这样在Ldap认证时就找不到了,从而走标准认证(这是在不重启Gitlab的情况下进行)。

    9.8K55

    Ruby Programming | 连载 03 - Ruby 对象基础

    上面提到了两个术语 发送 to_i 消息 和 调用 to_i 方法,这两个术语并不是完全相同。传递消息给对象时,对象会执行相应的方法,如果对象没有对应的方法则会报错 NoMethodError。...Ruby 的动态特性之一 Ruby 对象可以拦截位置的消息并使他们拥有具体的含义,Rails 框架中大量使用了拦截,发送位置的消息到对象并拦截该消息,然后能够在使用当前数据库表的列名作为动态条件的情况下顺畅运行...调用方法时也可以携带参数,参数使用 () 来包含参数,Ruby 对象调用方法时不携带参数可以将 () 省略。携带参数时 () 是可选的。...(刀):#{aus}" 在上述代码中通过定义一个 Exchange 类并且在类中定义了一个 yuan2aus 方法(行为),通过实例化 Exchange 来调用该方法,通过在键盘输入要转换的金额并调用该方法来实现汇率的换算...: 在使用 RubyMine 进行运行程序时只需要选中文件,并点击 Run 该文件即可 如果想要执行时添加参数,可以配置 Run/Debug Configurations: 执行该文件: 在使用

    2K20

    使用Capistrano,Nginx和Puma在Ubuntu 14.04上部署Rails应用程序

    Nginx将用于捕获客户端请求并将其传递给正运行Rails的Puma Web服务器。...我们将使用Capistrano自动执行常见的部署任务,因此每次我们必须将新版本的Rails应用程序部署到服务器时,我们都可以通过一些简单的命令来实现。...警告:禁用root登录后,请确保您可以作为部署用户SSH连接到服务器,并在关闭您打开的root SSH会话以进行这些更改之前为该用户使用sudo。 本教程中的所有命令都应以deploy用户身份运行。...输入以下命令来捆绑您的Rails应用程序: $ bundle 捆绑后,运行以下命令配置Capistrano: $ cap install 这将创建: Capfile 在您的Rails应用程序的根目录中...在管理Puma工作人员时将应用程序预加载到内存中 完成部署后启动(或重新启动)Puma服务器 在发行版中的特定位置打开Puma服务器的套接字 您可以根据需要更改所有选项。

    5K40

    Postgresql 数据库导入导出 物理VS逻辑 集合

    ,在导入的过程中就将修改后的数据导入 3 逻辑导入导出适合在业务工作期间,对表进行数据的导出或导入,可以最大化避免系统工作中的影响 4 物理导入导出主要应用场景为停机期间的大量数据的导出和导入,...数据库表结构以及其他OBJECT 和数据,到指定的 /home/postgres/backup.sql 文件中,其中数据使用copy方式呈现在导出文件中 pg_dump -d postgres -h...-p 5432 -U admin -a > /home/postgres/backup.sql 3 导出数据时添加删除语句,如目的地有同名表或OBJECT 将先进行清理后,在创建新表并灌入数据,此方式与...逻辑导入, 根据逻辑导出的数据的不同,数据的导入的方法也是不同的。...-a 方式导出的数据也为copy方式 2 通过copy 导出数据的方式中,如果涉及的表数量较多,可以同时运行多个表的数据导出,最大化的利用当下的硬件资源或通过pg_dump Fd 模式下的 -

    1.8K20

    GitLab企业级私有代码仓库安装与基础使用

    它允许用户在自己的服务器上运行类似于 GitHub 的项目管理系统,实现一个自托管私有的Git项目仓库,可通过Web界面进行访问公开的或者私人的项目Gitlab能够浏览源代码,管理缺陷和注释。...远程备份 描述:实际上就是在gitlab服务器上添加备份服务器的pub公钥,然后备份服务器访问Gitlab服务器进行拉取,当然您也可以采用rsync进行备份; #假设环境如下: #备份服务器: 192.168.1.2...PS : 但是需要注意的是新服务器上的Gitlab的版本必须与创建备份时的Gitlab版本号相同....在同一台Centos7机器上卸载了旧版本的gitlab后,接着又重新安装新版本的gitlab-ce 在安装完后修改配置,初始化配置时出现以下错误: Running handlers: There was...,这样在Ldap认证时就找不到了,从而走标准认证(这是在不重启Gitlab的情况下进行)。

    6.3K10

    PostgreSQL逻辑备份pg_dump使用及其原理解析

    dumpIdMap数组中 5)在导出表上执行LOCK TABLE %s IN ACCESS SHARE MODE 6)将所有元数据信息保存后,执行SET statement_timeout = 0保证语句不超时...Archive结构时,能为处理函数赋值为各自不同的处理函数。...这样在pg_dump.c中只需要根据用户指定的文件格式的参数,就可以调用相应的处理函数。见第一部分的第3步。 概况的说,pg_dump导出的内容可以分为数据库对象的定义和数据。...数据库对象的定义导出时通过查询系统表把对应元数据信息读取出来后,把该对象的各类信息置于一个链表上包括其依赖对象的oid。而具体的数据,也就是每个数据包的数据也被抽象为一个数据库对象,保存在此链表中。...所以,在内存中只是链表上对象的定义,数据是边读边写出的,可以使用流式读出。 三、使用方法 三、使用方法 1)以目录格式导出,需要和-f一起使用。

    2.2K20

    从零开始学PostgreSQL (六): 备份和恢复

    文件系统级备份 文件系统级备份是一种直接复制PostgreSQL数据库存储数据的文件的方法,这种方法虽然直观,但存在一些重要的局限性: 1、服务器停机需求: 必须停止数据库服务器以获得一致的备份,因为文件系统备份不能在数据库活动时提供原子快照...服务器内部的缓存机制和事务状态使得在服务器运行时的备份不完整或不一致。 2、整体备份限制: 备份整个数据库集群而不是单个数据库或表,因为表数据依赖于事务日志文件中的提交状态。...5、使用rsync进行备份: 使用rsync可以实现在服务器运行时的初步备份,然后在服务器短暂停止后进行最终一致性检查。 这种方法可以最小化停机时间,最终结果将是服务器关闭瞬间的一致状态。...它可以创建包含数据库集群所有必要数据文件的完整快照。 2、备份模式与性能: 在进行备份时,PostgreSQL进入备份模式,这可能会影响性能,特别是当服务器在高负载下运行时。...4、在服务器停止时备份:虽然推荐在服务器运行时进行备份以利用PostgreSQL的流复制和热备份特性,但在服务器停止时进行备份也是可能的。

    41510

    CentOS7安装维护Gitlab

    官方安装方法 下面是官网复制过来的官方安装方法,最简单的安装,在我大天朝,只能望天兴叹,你可访问外国网站安装或者略过这里,看下面的。...修改后使用gitlab-ctl reconfigure命令重载配置文件。 开始备份 这里放你的备份文件文件夹,和仓库源文件。...#连接成功后,后端服务器响应时间(代理接收超时) proxy_buffer_size 4k; #设置代理服务器(nginx)保存用户头信息的缓冲区大小 proxy_buffers...=production internal API unreachable 这个错误是一个自己制造的坑,我克隆和提交都没有办法搞,但是网站能正常运行,尝试了非常多的方法,最终我的问题是22端口没有隐射出去...R root:root /usr/local/nginx/proxy_temp # 编辑 nginx.conf sudo vi /usr/local/nginx/conf/nginx.conf # 在第一行添加

    5.1K30

    从零开始学PostgreSQL (十二):高效批量写入数据库

    之后运行 ANALYZE:数据加载完成后,应运行ANALYZE命令更新统计信息,这有助于查询优化器更好地规划查询计划,提升查询性能。...删除索引 对于新创建的表,最快的方法是先创建表,使用COPY批量加载数据,之后再创建所需索引。在已有数据上创建索引比逐行更新索引更快。...对于向现有表添加大量数据,可先删除索引,加载数据后重建,但需权衡对其他用户数据库性能的影响。 移除外键约束 与索引类似,外键约束可以批量检查,而非逐行检查,因此可以先移除,加载数据后重建。...注意事项 在进行上述操作时,务必确保数据完整性。例如,删除索引和外键约束后,应在数据加载完毕后立即重建,以维持数据一致性。...始终在安全的测试环境下试验这些方法,并在生产环境中实施前进行全面的备份和测试。

    51610

    PostgreSQL逻辑备份pg_dump使用及其原理浅析

    dumpIdMap数组中 5)在导出表上执行LOCK TABLE %s IN ACCESS SHARE MODE 6)将所有元数据信息保存后,执行SET statement_timeout = 0保证语句不超时...Archive结构时,能为处理函数赋值为各自不同的处理函数。...这样在pg_dump.c中只需要根据用户指定的文件格式的参数,就可以调用相应的处理函数。见第一部分的第3步。 概况的说,pg_dump导出的内容可以分为数据库对象的定义和数据。...数据库对象的定义导出时通过查询系统表把对应元数据信息读取出来后,把该对象的各类信息置于一个链表上包括其依赖对象的oid。而具体的数据,也就是每个数据包的数据也被抽象为一个数据库对象,保存在此链表中。...所以,在内存中只是链表上对象的定义,数据是边读边写出的,可以使用流式读出。 三、使用方法 1)以目录格式导出,需要和-f一起使用。

    2.2K10

    0694-5.10.2--如何将CM内嵌PostgreSQL服务迁移至外部PostgreSQL服务

    否则可能出现在运行scm_prepare_database.sh脚本时验证错误而失败。...注意:如果在停止Cloudera Manager Server之前未从Cloudera Manager中停止服务,则它们将继续运行并维护与嵌入式数据库服务器的网络连接。...注意:要成功运行pg_restore命令,数据库服务器上必须有现有数据库才能完成连接, 现有数据库不会被修改。...总结 1.在迁移过程中需要停止相关的服务和Cloudera Manager Server 2.在使用pg_restore命令导入数据库文件到外部PostgreSQL时,要成功运行pg_restore命令...3.在启动服务时,用到的数据库和用户信息需要在添加到/var/lib/pgsql/data/pg_hba.conf文件中,如下所示: ? 如不添加则启动服务时会报错: ?

    1.3K30

    使用Postgres做定时备份和脚本

    这是最灵活的格式,它允许对装载的数据和对象定义进行重新排列。 这个格式缺省的时候是压缩的。 -i --ignore-version 忽略在 pg_dump 和数据库服务器之间的版本差别。...如果你需要跨越版本检查时才使用这个选项( 而且如 pg_dump 失效,别说我没警告你)。 -n namespace --schema=schema 只转储 schema 的内容。...它告诉 pg_dump 包含在恢复数据时,临时关闭目标表上面的触发器的命令。 如果你在表上有参考完整性检查或者其它触发器,而恢复数据的时候你不想重载他们,那么你就应该使用这个选项。...-h host --host=host 声明运行服务器的机器的主机名。 如果数值以斜杠开头,则它被用做到 Unix 域套接字的路径。...pg_restore 还接受下面的命令行参数做为联接参数: -h host --host=host 声明服务器运行的机器的主机名。 如果数值以斜杠开头,那么它被用做 Unix 域套接字的目录。

    2.3K10
    领券