rds重建索引_rds索引重建_重建索引 - 腾讯云开发者社区

您找到你想要的搜索结果了吗？

是的

没有找到

基于Hadoop生态圈的数据仓库实践 —— 进阶技术（四）

2020年度20多款主流数据库重大更新及技术要点回顾

为方便阅读、重点呈现，本文对各板块内容进行了精简，需阅读完整版可点击文末【阅读原文】或登录云盘下载：https://pan.baidu.com/s/1h8plZz-amxxOMMWTL2eicQ（提取码：dwqg）

MySQL 慢日志线上问题分析及功能优化

MySQL 慢日志（slow log）是 MySQL DBA 及其他开发、运维人员需经常关注的一类信息。使用慢日志可找出执行时间较长或未走索引等 SQL 语句，为进行系统调优提供依据。本文将结合一个线上案例，分析如何正确设置 MySQL 慢日志参数和使用慢日志功能，并介绍下网易云 RDS 对 MySQL 慢日志功能的增强。

A云分布式数据库改造为腾讯云TDSQL MYSQL方案

A云Polardb-x 1.0现已全面升级为Polardb-x 2.0，但Polardb-X 1.0有其自有特色，仍然有很多企业在使用Polardb-X 1.0方案。那么，当这些企业想将业务系统迁移至腾讯云时，该如何进行数据库选型？怎么样进行数据同步？其中又会涉及到哪些问题呢？

020

HAWQ取代传统数仓实践（十四）——事实表技术之累积快照

本文总结了使用ETL处理大数据技术进行数据仓库建设的过程，包括数据提取、转换和加载（ETL）过程的构建和部署。主要介绍了ETL处理大数据的几种方法和技术，重点讲解了Apache NiFi和Talend这两个流行的开源ETL工具在大数据环境中的使用。

Grab 基于 Apache Hudi 实现近乎实时的数据分析

在数据处理领域，数据分析师在数据湖上运行其即席查询。数据湖充当分析和生产环境之间的接口，可防止下游查询影响上游数据引入管道。为了确保数据湖中的数据处理效率，选择合适的存储格式至关重要。

详解MySQL原生Online DDL:从历史演进到原理及使用

MySQL Online DDL 功能从 5.6 版本开始正式引入，发展到现在的 8.0 版本，经历了多次的调整和完善。本文主要就 Online DDL 的发展过程，以及各版本的区别进行总结。其实早在 MySQL 5.5 版本中就加入了 INPLACE DDL 方式，但是因为实现的问题，依然会阻塞 INSERT、UPDATE、DELETE 操作，这也是 MySQL 早期版本长期被吐槽的原因之一。

【沙龙干货】RDS平台介绍

今天我就给大家讲一下我们这边做的数据库运维的自动化平台，他是怎么样子的。首先我会给大家简单介绍一下我们做平台的背景，以及平台的一些技术架构，以及针对我们DBA和开发的需求的全套解决方案。首先是背景，我们为什么要做RDS，在做RDS之前其实我们也有一套自己的自动化系统，可是我们有了这套自动化系统我们发现有了之后我们DBA还是很忙，每天忙于工单处理，大表DDL，集群搭建，扩容，数据迁移等等。这些东西不能说没有价值，但是对于DBA来说，每一次的重复操作，都会让这个价值指数级下降，并且不能带来成长。所以我们对这些

postgresql 12 13 14 在索引上都进行了什么 (1 Btree index 优化为什么要升级到PG12)

从索引上可以看看到底这几年PG 12 -- PG13 --PG 14 他们都做了些什么改进，为什么PG 是最高级的开源数据库。

Python中概率累计分布函数（CDF）分析

PDF：连续型随机变量的概率密度函数是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。

Elastic可观测解决方案为集成插件启用时序数据流，可节省高达 70% 的指标存储空间

Elastic 可观测解决方案里面一些最常用的集成插件在最新版本里面默认使用更加经济高效的时间序列索引来存储指标数据。Kubernetes、Nginx、System、AWS、Azure、RabbitMQ、Redis 和更多的常用 Elastic 可观测集成插件开始支持时间序列数据流 (TSDS)。

Greenplum 实时数据仓库实践（7）——维度表技术

前面章节中，我们实现了实时多维数据仓库的基本功能，如使用Canal和Kafka实现实时数据同步，定义Greenplum rule执行实时数据装载逻辑等。本篇将继续讨论常见的维度表技术。

CentOS 7.4安装Mysql-5.7.18

这一节中，将依次介绍MySQL 5.7的各种新特性。由于MySQL 5.7改进较多，因此，本文将这些新特性进行了简单的分类，分为安全性、灵活性、易用性、可用性和性能。接下来，将从各个分类依次进行介绍。

基于Hadoop生态圈的数据仓库实践 —— 进阶技术（一）

一、增加列数据仓库最常碰到的扩展是给一个已经存在的维度表和事实表添加列。本节说明如何在客户维度表和销售订单事实表上添加列，并在新列上应用SCD2，以及对定时装载脚本所做的修改。假设需要在客户维度中增加送货地址属性，并在销售订单事实表中增加数量度量值。先看一下增加列时模式发生的变化。修改后源数据库模式如下图所示。

每周 Postgres 世界动态 2022w13

[每周 Postgres 世界动态] 本文全网唯一源地址产品新闻信息来源：网址基础上整理。无博客动态信息来源：网址作者文章

🤩 Monocle 3 | 太牛了！单细胞必学R包！~（三）（建立单细胞轨迹）

单细胞转录组、蛋白组、表观组学等单细胞技术的发展为研究细胞周期、细胞分化等细胞动态过程提供了新的机会。🤩

CentOS 7.4安装Mysql-5.7.18

HAWQ取代传统数仓实践（十一）——维度表技术之维度合并

有一种合并维度的情况，就是本来属性相同的维度，因为某种原因被设计成重复的维度属性。例如，在销售订单示例中，随着数据仓库中维度的增加，我们会发现有些通用的数据存在于多个维度中。客户维度的

010

OushuDB入门（五）——ETL篇

delete一张大表引发的一点思考

今天上班的时候接收到了一个业务方的反馈，说是一个数据库在删除表的时候报错了，我让他截给我日志看看，日志中的内容如下：

无服务器架构下的运维 | 洞见

在介绍运维之前，大家先来快速了解一下无服务器(serverless)的概念。由于笔者的实战经验是在AWS平台上，本文中出现的无服务器均指使用AWS Lambda构建的serverless应用。Serverless的特点是用户无需预配置或管理服务器，只需要部署功能代码，服务会在需要的时候执行代码并自动伸缩，从每天几个请求到每秒数千个请求，轻松地实现FaaS（Function as a Service）。如下图所示：

RDS PostgreSQL 存在的限制

经过测试使用发现，RDS PostgreSQL 存在限制的主要有两类 SQL 命令：

云数据库技术行业动态@2022-09-16

最近数据库行业还是发生一些事情，例如：NebulaGraph获得获得数千万美元的A轮融资，Oracle将在AWS支持MySQL HeatWave服务，VLDB 2022在悉尼举行，来自中国多篇成果被接收，等等，查看原文

redis主从架构（上）

redis的出现时间并不长，是NoSQL中的一种，基于键-值型的存储，与memcache类似，但是memcache中只是内存的缓存，而redis不仅是内存中的缓存，还提供持久存储，在2009年第一次发布redis。

容器化数据库必经之道

但是公司业务发展的速度实在太快，来了一个厂商或者应用就要求我们上线一个RDS实例，并且要求实例具备高可用、可扩展能力，随时上线或者下线，领导又要求提高物理硬件资源利用率。业务部门整天催着我们快速提供数据库服务，数据库实例多了后，运维难度和复杂度直线上升。公司IT发展战略朝着微服务和互联网化全面改造，DevOps建设又旨在打通运维和开发部门壁垒，作为DBA运维人员该如何适应这种转型？

HAWQ取代传统数仓实践（十）——维度表技术之杂项维度

本文描述了在电商场景中，如何使用阿里云MaxCompute来实现电商订单数据的ETL处理。主要包括了以下步骤：首先在MaxCompute中创建项目，然后使用DataHub模块中的Sqoop组件来实现数据的导入，接着使用DataHub中的Hive表作为外部表，通过Hive SQL进行数据处理。在处理过程中，使用MaxCompute提供的内置函数和UDF进行数据处理，最后将处理后的数据导出到Hdfs。

KLOOK客路旅行基于Apache Hudi的数据湖实践

客路旅行（KLOOK）是一家专注于境外目的地旅游资源整合的在线旅行平台，提供景点门票、一日游、特色体验、当地交通与美食预订服务。覆盖全球100个国家及地区，支持12种语言和41种货币的支付系统,与超过10000家商户合作伙伴紧密合作，为全球旅行者提供10万多种旅行体验预订服务。KLOOK数仓RDS数据同步是一个很典型的互联网电商公司数仓接入层的需求。对于公司数仓，约60%以上的数据直接来源与业务数据库，数据库有很大一部分为托管的AWS RDS-MYSQL 数据库，有超100+数据库/实例。RDS直接通过来的数据通过标准化清洗即作为数仓的ODS层，公司之前使用第三方商业工具进行同步，限制为每隔8小时的数据同步，无法满足公司业务对数据时效性的要求，数据团队在进行调研及一系列poc验证后，最后我们选择Debezium+Kafka+Flink+Hudi的ods层pipeline方案，数据秒级入湖，后续数仓可基于近实时的ODS层做更多的业务场景需求。

数据库硬盘空间可用小于90%解决的方案

我司在某云的MySQL数据库占硬盘空间大于90%，RDS空间总空间为 700G，表A分析之后。某渠道统计的表有5亿，单表空间超过350G。

前任都能看懂的分库分表方案

我们都知道，随着业务量的增长，数据量也会随之增加，这个时候就需要关注业务大表，因为大表会影响查询性能，DDL变更时间很长，影响业务的可用性，同时导致从库延迟很大，如果业务做了读写分离，导致用户重复操作产生脏数据，例如重复下单。

ELK总结——第三篇Logstash监控Nginx日志存入redis，实现服务解耦

为了节省资源，博主这里只搭建了一台，只有一台主的服务器。端口：6301密码：rds6301_paswd

PostgreSQL复制和备份的3种方法

Citus分布式数据库通过拆分，复制和查询并行扩展了PostgreSQL的。对于复制，我们的数据库即服务（默认情况下）利用Postgres内置的流复制逻辑。

HAWQ取代传统数仓实践（八）——维度表技术之角色扮演维度

单个物理维度可以被事实表多次引用，每个引用连接逻辑上存在差异的角色维度。例如，事实表可以有多个日期，每个日期通过外键引用不同的日期维度，原则上每个外键表示不同的日期维度视图，这样引用具

010

我们被一个 kong 的性能 bug 折腾了一个通宵

在 Erda 的技术架构中，我们使用了 kong 作为 API 网关的技术选型。因其具备高并发低延时的特性，同时结合了 Kubernetes Ingress Controller，基于云原生的声明式配置方式，能够实现丰富的 API 策略。

谈谈云计算

业界比较认可的几个分类：SAAS、PAAS、IAAS 1、SAAS（软件即服务）就是提供一种软件池，池中包括这样那样的内容，就像水电一样可以自由取送，然后按量收费，这是saas的一个宗旨。 saas具有的几个特点： 1）按需使用，客户根据自身的需求来决定使用多少服务以及服务的时间长短。现在很多公司都提出了这种模式，以租用的方式来销售软件，云邮件，云呼叫等，客户不必关心最终的服务是由什么开发，无论是java，.net，php，只需知道交纳费用就可以享受相应的服务，这就是saas的一个最大的特点。 2）能够

HAWQ取代传统数仓实践（三）——初始ETL（Sqoop、HAWQ）

本文通过介绍如何利用Sqoop对不同数据源进行数据导入，详细描述了Sqoop的导入流程、数据源配置、抽取和加载方式，并通过实例介绍了具体操作。

持续测试基础设施

基础设施作为应用程序的支柱，为之提供关键的运行环境、网络连接和资源调度等支持。一旦基础设施出现故障，整个应用生态系统都可能面临严重的连锁反应，如性能降低、数据丢失乃至系统崩溃。因此，基础设施的稳定性和可靠性对于运行在其上的应用程序至关重要。

数据库软件架构，到底要设计些什么？

强烈推介IDEA2020.2破解激活，IntelliJ IDEA 注册码，2020.2 IDEA 激活码

Oracle 重建索引的必要性

索引重建是一个争论不休被不断热烈讨论的议题。当然Oracle官方也有自己的观点，我们很多DBA也是遵循这一准则来重建索引，那就是Oracle建议对于索引深度超过4级以及已删除的索引条目至少占有现有索引条目总数的20% 这2种情形下需要重建索引。近来Oracle也提出了一些与之相反的观点，就是强烈建议不要定期重建索引。本文是参考了1525787.1并进行相应描述。

关系数据库大表拆分

维护索引（3）——通过重建索引提高性能

前言：重建一个索引只是在内部删除并重建索引，使得碎片消失、统计信息更新、物理顺序重新排列组织。它会压缩数据页，按照填充因子填充适当的数据。如果有需要，也会添加新的数据页。这些操作有利于提高数据查找的速度，但是这个工作如果发生在大表上面，将是非常耗时耗资源的。准备工作：首先先要决定是否达到了重建索引的临界值。否则，重组索引会更好。当碎片超过30%，那么重建索引会比较好。重建索引有两种方式，在重建之前应该考虑使用哪种会更好： 1、脱机：脱机重建索引是默认选项。它会锁住整个表，知道重建结束，没有人可以访

记录一次MySQL大表拆分和迁移

最近遇到一个关于MySQL单表过大的问题，该表存放的主要是日志文件，且其中有一个字段存放的数据过大，导致占用空间过大以及查询效率的降低，这种设计其实是不合理的。目前该表占用1.2T容量，数据量超过3亿条，而这个RDS数据库的容量总共就2T，且由于种种原因无法扩容，迫不得已急需给出解决方案。

上云不停服，自顶向下的平滑机房迁移方案！！！

《多机房多活架构，究竟怎么玩？》说明了在机房迁移的过程中，一定有一个“多机房多活”的中间状态：

TiDB 助力客如云餐饮 SaaS 服务

客如云成立于 2012 年，是全球领先、国内最大的 SaaS 系统公司。目前面向餐饮、零售等服务业商家，提供软硬一体的新一代智能化前台、收银等 SaaS 云服务，包括预订、排队、外卖、点餐、收银、会员管理、进销存等系统服务，并将数据实时传达云端。我们是客如云的大数据基础架构组，负责公司的大数据架构和建设工作，为公司提供大数据基础数据服务。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐