开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Postgres分区大小增加，但没有可选数据

PostgreSQL是一种关系型数据库管理系统，具有强大的可扩展性和灵活性。在PostgreSQL中，可以通过分区来优化查询性能并提高数据管理效率。

分区是将大型表分割成较小的逻辑部分的技术。通过这种方式，可以将数据按特定条件分开存储，从而减少查询时需要扫描的数据量。这样可以加快查询速度并提高数据库的整体性能。

对于提高查询性能来说，分区的大小是一个重要的考虑因素。分区的大小应根据具体情况进行调整，以确保每个分区内的数据量不会过大或过小。

当分区大小增加时，可以获得以下优势：

查询性能提升：分区可以减少查询时需要扫描的数据量，从而加快查询速度。
管理效率提高：分区可以将数据按特定条件进行分割存储，使得数据管理更加灵活和高效。
存储空间节省：通过分区可以避免无效数据的存储，从而节省存储空间。

PostgreSQL提供了多种分区策略，包括范围分区、列表分区和哈希分区等。可以根据不同的应用场景选择合适的分区策略。

在腾讯云的云数据库PostgreSQL中，可以使用分布式HTAP数据库TDSQL满足各种分区需求。TDSQL支持基于时间、地域、哈希和列表等多种分区策略，可灵活应对不同的业务场景。具体产品介绍和文档可以参考腾讯云官方网站： TDSQL

相关搜索:从具有不同列名和行大小但几乎没有重合值的两个数据帧并行表示的结果数据帧(Python)使用tez engine和ambari logs将数据加载到配置单元会显示完成，但日志在没有完成向这些分区插入的情况下会挂起有没有一种方法可以使用数据增强来增加带有标签的数据集的大小？双11营业执照智能识别选购双11增值税发票识别选购双11增值税发票智能核验选购双11增值税发票智能识别选购双11发票识别选购双11发票智能识别选购双11智能扫码选购

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

从 Notion 分片 Postgres 中吸取的教训(Notion 工程团队)

https://www.notion.so/blog/sharding-postgres-at-notion

02

在 Kubernetes 上快速测试 Citus 分布式 PostgreSQL 集群(分布式表，共置，引用表，列存储)

这里假设，你已经在 k8s 上部署好了基于 Citus 扩展的分布式 PostgreSQL 集群。

02

进阶数据库系列（十二）：PostgreSQL 索引技术详解

索引主要被用来提升数据库性能，不当的使用会导致性能变差。 PostgreSQL 提供了多种索引类型： B-tree、Hash、GiST、SP-GiST 、GIN 和 BRIN。每一种索引类型使用了一种不同的算法来适应不同类型的查询。默认情况下，CREATE INDEX 命令创建适合于大部分情况的 B-tree 索引。

04

PG 13新特性汇总

PostgreSQL 10 版本开始支持逻辑复制，在12版本之前逻辑复制仅支持普通表，不支持分区表，如果需要对分区表进行逻辑复制，需单独对所有分区进行逻辑复制。

01

GreenPlum中的数据库对象

greenplum Schema 是 Database中逻辑组织object和data。在同一Database中，不同schema的对象可以使用相同的名称。

02

Postgres 10 开发者新特性

目前非常流行的RDBMS PostgresSQL已经在几周前发布了它的第10个版本。由于Postgres的可靠性、节约成本、成熟，当然还有它的开源，已经21岁的Postgres在开发者之中仍旧非常流行。

02

MySQL8和PostgreSQL10功能对比

现在MySQL 8和PostgreSQL 10已经发布，现在是重新审视两个主要的开源关系数据库如何相互竞争的好时机。

02

Postgresql分区表大量实例与分区建议（LIST / RANGE / HASH / 多级混合分区）

5.11.6. Best Practices for Declarative Partitioning

02

降本百万！Notion 基于Apache Hudi构建LakeHouse

这篇博文是由 Notion 数据平台团队的软件工程师 Thomas Chow 和 Nathan Louie 于 2023 年 12 月 13 日发表的题为 Notion's Journey Through Different Stages of Data Scale 的 Hudi 现场活动的简短摘要。下面的视频剪辑给出了Notion 演讲的简短摘要，还可以查看演讲幻灯片[1]或查看完整演讲[2]。

01

Citus 11 官方手册脑图 - PostgreSQL 超大规模分布式数据库解决方案上手指南

📷 官方手册：https://docs.citusdata.com 📷 脑图大纲入门什么是Citus？ Citus 可以扩展多远？何时使用 Citus 多租户数据库实时分析使用注意事项何时 Citus 不合适快速教程多租户应用程序数据模型和示例数据创建表分发表和加载数据运行查询实时分析数据模型和样本数据创建表分发表和加载数据运行查询安装单节点 Citus Docker (Mac 或 Linux) Ubuntu 或 Debian Fedora, CentOS, 或 Re

03

PostgreSQL数据库的版本历史及关键变化

PostgreSQL是一个强大的开源关系型数据库，它的发展历程充满了创新和卓越的设计。让我们回顾一下PostgreSQL的主要版本和每个版本的关键特性。

04

分布式 PostgreSQL 集群(Citus)官方示例 - 时间序列数据

在时间序列工作负载中，应用程序（例如一些实时应用程序查询最近的信息，同时归档旧信息。

03

Snova架构篇（一）：Greenplum MPP核心架构

参考文章：https://doc.huodongjia.com/detail-3839.html Hashdata 简丽荣

01

postgresql主从复制配置「建议收藏」

postgresql主从复制是一种高可用解决方案，可以实现读写分离。postgresql主从复制是基于xlog来实现的，主库开启日志功能，从库根据主库xlog来完成数据的同步。

03

HMS数据库设置和优化

如果您有本地集群，则需要知道如何为 Hive Metastore (HMS) 设置后端数据库。设置包括安装受支持的数据库、配置属性、指定 Metastore 位置。您还可以配置可选的连接参数。

03

PostgreSQL10分区表性能研究报告

作者简介：田磊磊 PostgreSQL、Greenplum高级数据库工程师，熟悉PG技术栈，对OLTP/OLAP均有深入实操经验，目前就职于哈啰出行，维护着国内最大的PG集群之一，超过400个PG实例。微信号：TLL-PostgreSQL-MySQL

01

HStreamDB Newsletter 2022-07｜分区模型优化、数据集成框架进一步完善

本月，HStreamDB 团队主要在进行 v0.9 的最后开发和发布准备工作，对 v0.9 即将带来的 stream 分区模型改进、新集群机制、HStream IO 等新特性进行了进一步的完善和测试，同时也将主要的客户端升级到适配 v0.9。

02

“王者对战”之 MySQL 8 vs PostgreSQL 10

本文是对两大开源关系型数据库MySQL、PostgreSQL做了详细的对比，欢迎大家在评论区发表自己的见解。

02

PostgreSQL 14及更高版本改进

http://amitkapila16.blogspot.com/2021/07/logical-replication-of-in-progress.html

04

OushuDB 产品基本介绍——表

OushuDB表由行（rows）和（columns）组成。每一个列有一个列名和一个数据类型，一个表的列数和列的顺序是固定的。一个表的行数是可变的。SQL并不假设表中行的顺序。当读一个表时，除非显示要求排序，返回的行会以任意顺序出现。另外，SQL并不给每一行一个唯一标志符，所以，一个表中具有同样几个同样的行是可能的。

02

Postgresql表空间

不同的数据库表空间有不同的定义：在 postgres 中，表空间允许在文件系统中定义数据库对象存储的位置，实质上就是指定了一个目录。与数据库的关系在 postgres 中，一个表空间可以让多个数据库使用，而一个数据库也可以使用多个表空间，属于“多对多”的关系；在 oracle 中，一个表空间只属于一个数据库，而一个数据库可以使用多个表空间，属于“一对多”的关系。

05

openGauss与PostgreSQL分区策略语法测试

PostgreSQL支持继承，版本10之前的分区表都是通过继承特性来实现，每个分区实际上都是一个独立的表。数据更新可通过触发器trigger或者规则rule来实现。

04

Zabbix4.2新功能实践1-时间序列数据库TimescaleDB

4月2号万众期待的Zabbix4.2终于发布了！新版本提供了很多特性，接下来几期主要介绍Zabbix4.2的一些新特性的使用。本次主要介绍TimescaleDB。

02

Robinhood基于Apache Hudi的下一代数据湖实践

Robinhood 的使命是使所有人的金融民主化。Robinhood 内部不同级别的持续数据分析和数据驱动决策是实现这一使命的基础。我们有各种数据源——OLTP 数据库、事件流和各种第 3 方数据源。需要快速、可靠、安全和以隐私为中心的数据湖摄取服务来支持各种报告、关键业务管道和仪表板。不仅在数据存储规模和查询方面，也在我们在数据湖支持的用例方面，我们从最初的数据湖版本[1]都取得了很大的进展。在这篇博客中，我们将描述如何使用各种开源工具构建基于变更数据捕获的增量摄取，以将我们核心数据集的数据新鲜延迟从 1 天减少到 15 分钟以下。我们还将描述大批量摄取模型中的局限性，以及在大规模操作增量摄取管道时学到的经验教训。

02

uos-server-20-1060e 文件系统LVM逻辑卷管理

LVM是逻辑盘卷管理（LogicalVolumeManager）的简称，在Linux环境下对磁盘分区进行管理的一种机制，LVM是建立在硬盘和分区之上的一个逻辑层，来提高磁盘分区管理的灵活性。通过LVM系统管理员可以轻松管理磁盘分区，扩容文件系统，LVM将若干个磁盘分区连接为一个整块的卷（volumegroup），形成一个存储池。管理员可以在卷组上随意创建逻辑卷组（logicalvolumes），并进一步在逻辑卷组上创建文件系统。

01

Postgresql日志收集

PG安装完成后默认不会记录日志，必须修改对应的（${PGDATA}/postgresql.conf）配置才可以，这里只介绍常用的日志配置。

01

Greenplum 计算能力估算

Greenplum master节点是用来存储元数据的，包括: 序列，表，临时表，分区，函数，视图，类型，操作符，规则，触发器等。

01

史上最全PostgreSQL体系结构

墨墨导读：本文主要从日志文件、参数文件、控制文件、数据文件、redo日志（WAL）、后台进程这六个方面来讨论PostgreSQL的结构。

02

分布式 PostgreSQL，Citus(11.x) 效用函数

本文包含 Citus 提供的用户定义函数的参考信息。这些函数有助于为 Citus 提供除标准 SQL 命令之外的其他分布式功能。

02

PostgreSQL14：自动hash和list分区？

PG10中引入了声明式分区，自此随着各个版本的发布，此项功能逐渐完善。以下功能PG14之前版本已支持：

03

使用ClickHouse对每秒6百万次请求进行HTTP分析

我们在Cloudflare的一个大规模数据基础架构挑战是为我们的客户提供HTTP流量分析。我们所有客户都可以通过两种方式使用HTTP分析：

02

MogDB与PostgreSQL分区策略语法测试

PostgreSQL支持继承，版本10之前的分区表都是通过继承特性来实现，每个分区实际上都是一个独立的表。数据更新可通过触发器trigger或者规则rule来实现。

02

PG 14新特性汇总

从PG1开始，ALTER TABLE DETACH 支持 CONCURRENTLY，避免因ALTER TABLE DETACH忘记设置statement_timeout参数而长时间锁表。

时序数据库应用_tsdb时序数据库

mysql可能大家都用的比较多且普遍，最近1年在使用PostgreSql，其大体DML语句与mysql类似，只是部分DDL语句有些区别，写一篇文章给正在应用该数据库或者准备选型该数据库的朋友，分享下使用方式与心得

02

基于Apache Hudi和Debezium构建CDC入湖管道

当想要对来自事务数据库（如 Postgres 或 MySQL）的数据执行分析时，通常需要通过称为更改数据捕获[4] CDC的过程将此数据引入数据仓库或数据湖等 OLAP 系统。Debezium 是一种流行的工具，它使 CDC 变得简单，其提供了一种通过读取更改日志[5]来捕获数据库中行级更改的方法，通过这种方式 Debezium 可以避免增加数据库上的 CPU 负载，并确保捕获包括删除在内的所有变更。现在 Apache Hudi[6] 提供了 Debezium 源连接器，CDC 引入数据湖比以往任何时候都更容易，因为它具有一些独特的差异化功能[7]。Hudi 可在数据湖上实现高效的更新、合并和删除事务。Hudi 独特地提供了 Merge-On-Read[8] 写入器，与使用 Spark 或 Flink 的典型数据湖写入器相比，该写入器可以显着降低摄取延迟[9]。最后，Apache Hudi 提供增量查询[10]，因此在从数据库中捕获更改后可以在所有后续 ETL 管道中以增量方式处理这些更改下游。

02

优化PG查询：一问一答

可以使用Postgres Exporter采集PG的各种指标，并将其发送给普罗米修斯。更多详细信息参考：

03

Postgresql主从复制

Postgresql主从复制 📷 主备数据库启动，备库启动wal_receiver进程，wal进程向主库发送连接请求；主库收到连接请求后启动wal_sender进程，并与wal_receiver进程建立tcp连接；备库wal_receiver进程发送最新的wal lsn 给主库；主库进行lsn 对比，定期向备库发送心跳信息，来确认备库的可用性，并且将没有传递的wal日志文件进行发送，同时调用SyncRepWaitForLSN()函数来获取锁存器，并且等待备库响应；锁存器的释放时机和主备同步模式的选择有

02

【PostgreSQL 】PostgreSQL 12的8大改进，性能大幅度提升

PostgreSQL 12专注于性能和优化。此版本的发布并未考虑到全新的闪亮功能；相反，它是对现有PostgreSQL功能的微调和精心设计的实现。因为PostgreSQL每年都会发布新版本，所以并不是每一个新功能都完全具备。在发布了几个版本之后，当该功能有机会从其最初的实现中发展出来时，其性能将得到改善，边缘情况将得到支持，缺失的功能将得到实现。

02

PostgreSQL逻辑备份pg_dump使用及其原理浅析

1、循环调用getopt_long解析命令行参数，将参数保存到static DumpOptions dopt;中 2、判断参数是否相容，不相容则退出： options -s/--schema-only and -a/--data-only cannot be used together options -c/--clean and -a/--data-only cannot be used together options --inserts/--column-inserts and -o/--oids cannot be used together option --if-exists requires option -c/--clean

01

PostgreSQL逻辑备份pg_dump使用及其原理解析

1、循环调用getopt_long解析命令行参数，将参数保存到static DumpOptions dopt;中 2、判断参数是否相容，不相容则退出：

02

ApacheDoris系列｜Bucket(分桶)数量设置和自动分桶

问题描述：上线运行一段时间后，随着越来越多的数据增长，集群每次重启后一周左右，读写就会开始变得越来越慢，直到无法正常进行读写。

03

LLM如何助我打造Steampipe的ODBC插件

Jon Udell运用ChatGPT、Cody以及GitHub Copilot来协助他为Steampipe开发ODBC插件，后者是一个可扩展的SQL接口，用以连接云API。

01

印尼医疗龙头企业Halodoc的数据平台转型之Lakehouse架构

在 Halodoc，我们始终致力于为最终用户简化医疗保健服务，随着公司的发展，我们不断构建和提供新功能。我们两年前建立的可能无法支持我们今天管理的数据量，以解决我们决定改进数据平台架构的问题。在我们之前的博客中，我们谈到了现有平台的挑战以及为什么我们需要采用 Lake House 架构来支持业务和利益相关者以轻松访问数据。在这篇博客中，我们将讨论我们的新架构、涉及的组件和不同的策略，以拥有一个可扩展的数据平台。

02

[ES三周年]PostgreSQL数据的存储基础知识

OID 是 PostgreSQL 内部用于标识数据库对象(数据库，表**，视图，**存储过程等等)的标识符，用4个字节的无符号整数表示。它是PostgreSQL大部分系统表的主键。

06

Postgres-XL 10R1 release版本发布

2018年10月25日2ndQuadrant发布了Postgres-XL 10R1版本。Postgres-XL是一个大规模并行数据库，它基于PG社区版本开发，并和PG高度兼容，支持Business Intelligence负载和读写大事务负载。

02

Postgresql中的MVCC与并发

ACID中的C即一致性在PG内部使用MVCC机制来保证。MVCC多版本并发控制为数据加上时间戳，读写需要额外的根据自身时间戳与数据时间戳对比，按照既定的规则可以知道这条数据对当前的SQL是否可见。MVCC避免了传统的锁方法，将锁竞争最小化来获得更高的性能。

02

进阶数据库系列（十）：PostgreSQL 视图与触发器

视图（View）本质上是一个存储在数据库中的查询语句。视图本身不包含数据，也被称为虚拟表。我们在创建视图时给它指定了一个名称，然后可以像表一样对其进行查询。

01

Portworx Essential上手操作指南

Kubernetes架构对于初学者来说还是比较复杂，尤其是在Kubernetes上运行有状态应用，有时用户还并不需要企业级规模的功能。因此Portworx发布Portworx Essentials版本，它为小型生产环境提供了所有必要的Kubernetes存储功能，而且是永久免费的。

00

数据库PostrageSQL-管理内核资源

PostgreSQL某些时候会耗尽操作系统的各种资源限制，当同一个系统上运行着多个拷贝的服务器或在一个非常大的安装中时尤其如此。本节解释了PostgreSQL使用的内核资源以及你可以采取的用于解决内核资源消耗相关问题的步骤。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭