前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >技术分享 | 基于 PROXYSQL 查找从未使用过的表

技术分享 | 基于 PROXYSQL 查找从未使用过的表

作者头像
爱可生开源社区
发布2021-04-23 10:20:45
4630
发布2021-04-23 10:20:45
举报

作者:RAY

DBA,9 年数据库实战经验,尤其专注于 MySQL 技术栈,Oracle 11g OCP,现任天天鉴宝首席 DBA,负责设计公司整体数据架构与保障数据库服务高安全,高可用与高性能地运行。

本文来源:原创投稿

*爱可生开源社区出品,原创内容未经授权不得随意使用,转载请联系小编并注明来源。


前言

当你半路接手一个生产业务库时,可能会发现其中很多的表命名很像废弃表、备份表或者归档表,比如以 “tmp”、“copy”、“backup” 和日期等等后缀的表名。当然这些都是最直观的判断,可能依然会有很多因为历史遗留问题产生的垃圾表,然而直接通过表命名无法准确判断是否可以清理,那么如果长时间不清理会带来什么问题吗?

首先按照生产环境的标准,这些或测试,或临时备份的表都不应该保留,并且在分析元数据时会增加额外的工作量。

其次有些表的体积过于庞大,浪费大量存储空间,最后因为这些历史遗留问题没有及时解决,随着时间的流逝导致问题会越来越复杂,越来越难以追溯。

综上所述,我需要一种可靠的技术手段去统计到底哪些表长时间没有访问过,这时有些人会说 general log 可以统计,但是生产数据库不会开启此项参数,毕竟比较影响磁盘的性能。

Proxysql 作为一款优秀的中间件,stats_mysql_query_digest 表默认记录着所有的数据库请求,可以从此表分析出从未使用过的表(时间越久分析越准确,毕竟不排除有些表的访问周期比较长)。

实现方法

  1. 导出全量表
代码语言:javascript
复制
mysql -uroot -pxxx -s -e "SELECT TABLE_NAME FROM information_schema.TABLES WHERE TABLE_SCHEMA in ('test');" > table_name.txt
  1. 循环打印最后一次访问时间和从未使用过的表名称
代码语言:javascript
复制
for i in `cat table_name.txt`;do mysql -u admin -p'xxx' -h 127.0.0.1 -P6032 --default-auth=mysql_native_password -s -e "select ifnull((SELECT from_unixtime(last_seen+28800) FROM stats_mysql_query_digest where digest_text like '%${i}%'),'${i}');";done > ./unused.txt

查看文件输出如下:

代码语言:javascript
复制
2021-03-23 13:42:37
2021-03-23 14:43:56
tb2
tb3
  1. 删除最后一次访问时间
代码语言:javascript
复制
sed '/:/d' unused.txt (不修改文件)
sed -i '/:/d' unused.txt (修改文件)

删除后如下图所示:

代码语言:javascript
复制
tb2
tb3
  1. 人工确认是否可以清理

此筛选出的表需要与项目负责人确认是否可以清理,如果确认可以清理,也不是直接物理删除,需要 rename 统一的后缀名,并且再观察一段时间是否有人反馈因为访问不到表产生的问题,如果不再出现任何问题,那么就可以放心地清理了。

附批量生成 rename 语句:

代码语言:javascript
复制
SELECT
 CONCAT( 'ALTER TABLE ', TABLE_NAME, ' RENAME ', TABLE_NAME, '_unused;' ) 
FROM
 INFORMATION_SCHEMA.TABLES 
WHERE
table_schema IN ( 'unused' ) AND  TABLE_TYPE='BASE TABLE';

SELECT
 CONCAT( 'ALTER TABLE ', TABLE_NAME, ' RENAME ', TABLE_NAME, '_unused;' ) 
FROM
 INFORMATION_SCHEMA.TABLES 
WHERE
table_name IN ( 'table1', 'table2' …) AND  TABLE_TYPE='BASE TABLE';

注:如果筛选出的表过多,可以新建一个数据库 “unused” 包含所有未使用的表,或者使用文本编辑工具批量生成 “'table1', 'table2' …”,反之手动复制粘贴即可。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-04-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 爱可生开源社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 实现方法
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档