前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >一文搞定MySQL性能调优

一文搞定MySQL性能调优

作者头像
全菜工程师小辉
发布2019-09-05 18:06:06
9420
发布2019-09-05 18:06:06
举报

数据库的操作越来越成为整个应用的性能瓶颈,这对于Web应用尤其明显。关于数据库的性能,这并不只是DBA需要关心的,而更是后端开发需要去关注的事情。

所以本文讲解MySQL在各个方面的优化方向,方便后端开发人员在调优和问题排查过程中找到切入点。

本文目录如下:

代码语言:javascript
复制
|-- 服务器硬件的优化
|-- MySQL数据库配置优化
|-- CentOS系统针对mysql的参数优化
    |-- 内核相关参数(/etc/sysctl.conf)
    |-- 增加资源限制(/etc/security/limit.conf)
    |-- 磁盘调度策略
|-- MySQL的参数配置
|-- MySQL表结构与SQL优化
    |-- 索引优化规则
        |-- 1.使用最左前缀规则
        |-- 2.模糊查询不能利用索引(like '%XX'或者like '%XX%')
        |-- 3.不要过多创建索引
        |-- 4.索引长度尽量短
        |-- 5.索引更新不能频繁
        |-- 6.索引列不能参与计算
    |-- 查询时的优化
        |-- 小表驱动大表
        |-- 避免全表扫描
        |-- 避免mysql放弃索引查询
        |-- 使用覆盖索引,少使用select*
        |-- order by的索引生效
        |-- 不正确的使用导致索引失效
        |-- for update锁表
    |-- 其他优化
        |-- 开启慢查询
        |-- 实时获取有性能问题的SQL
        |-- 垂直分割
        |-- 拆分执行时间长的DELETE或INSERT语句
|-- 好书推荐
    |-- 高性能MySQL
    |-- 阿里巴巴Java开发手册

本文配置均为参考值,实际设置要参考基准测试或现场环境。

服务器硬件的优化

提升硬件设备,例如选择尽量高频率的内存(频率不能高于主板的支持)、提升网络带宽、使用SSD高速磁盘、提升CPU性能等。

CPU的选择:

  • 对于数据库并发比较高的场景,CPU的数量比频率重要。
  • 对于CPU密集型场景和频繁执行复杂SQL的场景,CPU的频率越高越好。

MySQL数据库配置优化

  • 表示缓冲池字节大小。 推荐值为物理内存的50%~80%。 innodb_buffer_pool_size
  • 用来控制redo log刷新到磁盘的策略。 innodb_flush_log_at_trx_commit=1
  • 每提交1次事务同步写到磁盘中,可以设置为n。 sync_binlog=1
  • 脏页占innodb_buffer_pool_size的比例时,触发刷脏页到磁盘。推荐值为25%~50%。 innodb_max_dirty_pages_pct=30
  • 后台进程最大IO性能指标。 默认200,如果SSD,调整为5000~20000 innodb_io_capacity=200
  • 指定innodb共享表空间文件的大小。 innodb_data_file_path
  • 慢查询日志的阈值设置,单位秒。 long_qurey_time=0.3
  • mysql复制的形式,row为MySQL8.0的默认形式。 binlog_format=row
  • 调高该参数则应降低interactive_timeout、wait_timeout的值。 max_connections=200
  • 过大,实例恢复时间长;过小,造成日志切换频繁。 innodb_log_file_size
  • 全量日志建议关闭。 默认关闭。 general_log=0

CentOS系统针对mysql的参数优化

本节只提及部分重要的参数,更全面的参数优化,可以查看这本书。

内核相关参数(/etc/sysctl.conf)

以下参数可以直接放到sysctl.conf文件的末尾。

1.增加监听队列上限:

net.core.somaxconn = 65535 net.core.netdev_max_backlog = 65535 net.ipv4.tcp_max_syn_backlog = 65535

2.加快TCP连接的回收:

net.ipv4.tcp_fin_timeout = 10 net.ipv4.tcp_tw_reuse = 1 net.ipv4.tcp_tw_recycle = 1

3.TCP连接接收和发送缓冲区大小的默认值和最大值:

net.core.wmem_default = 87380 net.core.wmem_max = 16777216 net.core.rmem_default = 87380 net.core.rmem_max = 16777216

4.减少失效连接所占用的TCP资源的数量,加快资源回收的效率:

net.ipv4.tcp_keepalive_time = 120 net.ipv4.tcp_keepalive_intvl = 30 net.ipv4.tcp_keepalive_probes = 3

5.单个共享内存段的最大值:

kernel.shmmax = 4294967295

  1. 这个参数应该设置的足够大,以便能在一个共享内存段下容纳整个的Innodb缓冲池的大小。
  2. 这个值的大小对于64位linux系统,可取的最大值为(物理内存值-1)byte,建议值为大于物理内存的一半,一般取值大于Innodb缓冲池的大小即可。

6.控制换出运行时内存的相对权重:

vm.swappiness = 0

这个参数当内存不足时会对性能产生比较明显的影响。(设置为0,表示Linux内核虚拟内存完全被占用,才会要使用交换区。)

Linux系统内存交换区: 在Linux系统安装时都会有一个特殊的磁盘分区,称之为系统交换分区。 使用 free -m 命令可以看到swap就是内存交换区。 作用:当操作系统没有足够的内存时,就会将部分虚拟内存写到磁盘的交换区中,这样就会发生内存交换。

如果Linux系统上完全禁用交换分区,带来的风险:

  1. 降低操作系统的性能
  2. 容易造成内存溢出,崩溃,或都被操作系统kill掉

增加资源限制(/etc/security/limit.conf)

打开文件数的限制(以下参数可以直接放到limit.conf文件的末尾):

* soft nofile 65535 * hard nofile 65535

*:表示对所有用户有效 soft:表示当前系统生效的设置(soft不能大于hard ) hard:表明系统中所能设定的最大值 nofile:表示所限制的资源是打开文件的最大数目 65535:限制的数量

以上两行配置将可打开的文件数量增加到65535个,以保证可以打开足够多的文件句柄。

注意:这个文件的修改需要重启系统才能生效。

磁盘调度策略

1.cfq (完全公平队列策略,Linux2.6.18之后内核的系统默认策略)

该模式按进程创建多个队列,各个进程发来的IO请求会被cfq以轮循方式处理,对每个IO请求都是公平的。该策略适合离散读的应用。

2.deadline (截止时间调度策略)

deadline,包含读和写两个队列,确保在一个截止时间内服务请求(截止时间是可调整的),而默认读期限短于写期限。这样就防止了写操作因为不能被读取而饿死的现象,deadline对数据库类应用是最好的选择。

3.noop (电梯式调度策略)

noop只实现一个简单的FIFO队列,倾向饿死读而利于写,因此noop对于闪存设备、RAM及嵌入式系统是最好的选择。

4.anticipatory (预料I/O调度策略)

本质上与deadline策略一样,但在最后一次读操作之后,要等待6ms,才能继续进行对其它I/O请求进行调度。它会在每个6ms中插入新的I/O操作,合并写入流,用写入延时换取最大的写入吞吐量。anticipatory适合于写入较多的环境,比如文件服务器。该策略对数据库环境表现很差。

查看调度策略的方法:

cat /sys/block/devname/queue/scheduler

修改调度策略的方法:

echo <schedulername> > /sys/block/devname/queue/scheduler

MySQL的参数配置

请阅读笔者的CSDN博客《MySQL服务器参数配置》,点击跳转。如无法跳转,请查看原文即可查看。

MySQL表结构与SQL优化

索引优化规则

结合笔者的上一篇博客——《彻底搞懂MySQL的索引》,可以很容易理解索引优化的原理。

1.使用最左前缀规则

如果使用联合索引,要遵守最左前缀规则。即要求使用联合索引进行查询,从索引的最左前列开始,不跳过索引中的列并且不能使用范围查询(>、<、between、like)。

2.模糊查询不能利用索引(like '%XX'或者like '%XX%')

假如索引列code的值为'AAA','AAB','BAA','BAB',如果where code like '%AB'条件,由于条件前面是模糊的,所以不能利用索引的顺序,必须逐个查找,看是否满足条件。这样会导致全索引扫描或者全表扫描。

如果是where code like 'A%',就可以查找code中A开头的数据,当碰到B开头的数据时,就可以停止查找了,因为后面的数据一定不满足要求,这样可以提高查询效率。

3.不要过多创建索引

过多的索引会占用更多的空间,而且每次增、删、改操作都会重建索引。

在一般的互联网场景中,查询语句的执行次数远远大于增删改语句的执行次数,所以重建索引的开销可以忽略不计。但在大数据量导入时,可以考虑先删除索引,批量插入数据,然后添加索引。

尽量扩展索引,比如现有索引(a),现在又要对(a,b)进行索引,那么只需要修改索引(a)即可,避免不必要的索引冗余。

4.索引长度尽量短

短索引可以节省索引空间,使查找的速度得到提升,同时内存中也可以装载更多的索引键值。

太长的列,可以选择建立前缀索引

5.索引更新不能频繁

更新非常频繁的数据不适宜建索引,因为维护索引的成本。

6.索引列不能参与计算

不要在索引列上做任何的操作,包括计算、函数、自动或者手动类型的转换,这样都会导致索引失效。

比如,where from_unixtime(create_time) = ’2014-05-29’就不能使用到索引,原因很简单,b+树中存的都是数据表中的字段值,但进行检索时,需要把所有元素都应用函数才能比较,显然成本太大。所以语句应该写成where create_time = unix_timestamp(’2014-05-29’)。

查询时的优化

小表驱动大表

第一张表是全表索引(要以此关联其他表),其余表的查询类型type为range(索引区间获得),也就是6 * 1 * 1,共遍历查询6次即可;

建议使用left join时,以小表关联大表,因为使用join的话,第一张表是必须全扫描的,以少关联多就可以减少这个扫描次数.

这里所说的表的type,指的是explain执行计划中的结果字段。详情点击查看,explain的属性详解与提速百倍的优化示例

避免全表扫描

mysql在使用不等于(!=或者<>)的时候无法使用导致全表扫描。在查询的时候,如果对索引使用不等于的操作将会导致索引失效,进行全表扫描

避免mysql放弃索引查询

如果mysql估计使用全表扫描要比使用索引快,则不使用索引。(最典型的场景就是数据量少的时候)

使用覆盖索引,少使用select*

需要用到什么数据就查询什么数据,这样可以减少网络的传输和mysql的全表扫描。

尽量使用覆盖索引,比如索引为name,age,address的组合索引,那么尽量覆盖这三个字段之中的值,mysql将会直接在索引上取值(using index),并且返回值不包含不是索引的字段。

如果查询select的列过多,覆盖索引的效率会大大下降,这时可以考虑放弃覆盖索引查询。

order by的索引生效

order by排序应该遵循最佳左前缀查询,如果是使用多个索引字段进行排序,那么排序的规则必须相同(同是升序或者降序),否则索引同样会失效。

不正确的使用导致索引失效

如果查询中有某个列的范围查询,则其右边所有列都无法使用索引。

for update锁表

A, B两个事务分别使用select ... where ... for update进行查询时:

  1. A事务执行查询操作的时候,如果这个查询结果为空,无论where条件是否是索引字段,B事务执行查询操作时,不会被阻塞。
  2. A事务执行查询操作的时候,当where条件是索引字段,则B事务执行同样的查询时会被行加锁阻塞;当where条件不是索引字段,则B事务执行有结果集的查询,都会被阻塞。

for update操作一定要谨慎,之前笔者就遇到过for update产生gap锁,导致后续请求阻塞的问题。 之后的博客单独介绍MySQL的锁机制,同时讲解下更多死锁的情况。

其他优化

开启慢查询

开启慢查询日志,可以让MySQL记录下查询超过指定时间的语句,通过定位分析性能的瓶颈,更好的优化数据库系统的性能。

以后单独的博客进行详细的讲解

实时获取有性能问题的SQL

利用information_schema数据库的processlist表,实时查看执行时间过长的线程,定位需要优化的SQL。

例如下面的SQL的作用是查看正在执行的线程,并按Time倒排序,查看执行时间过长的线程。

select * from information_schema.processlist where Command != 'Sleep' order by Time desc;

垂直分割

“垂直分割”是一种把数据库中的表,按列变成几张表的方法。这样可以降低表的复杂度和字段的数目,从而达到优化的目的。

示例一:

在Users表中有一个字段是address,它是可选字段,并且不需要经常读取或是修改。

那么,就可以把它放到另外一张表中,这样会让原表有更好的性能。

示例二:

有一个叫 “last_login”的字段,它会在每次用户登录时被更新,每次更新时会导致该表的查询缓存被清空。

所以,可以把这个字段放到另一个表中。

这样就不会影响对用户ID、用户名、用户角色(假设这几个属性并不频繁修改)的不停地读取了,因为查询缓存会增加很多性能。

拆分执行时间长的DELETE或INSERT语句

避免在生产环境上执行会锁表的DELETE或INSERT的操作。一定把其拆分,或者使用LIMIT条件也是一个好的方法。

下面是一个示例:

代码语言:javascript
复制
while (1) {

    //每次只做1000条
    mysql_query("DELETE FROM logs WHERE log_date <= '2009-11-01' LIMIT 1000");

    if (mysql_affected_rows() == 0) {
        // 没得可删了,退出!
        break;
    }

    // 每次都要休息一会儿
    usleep(50000);
}

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-09-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 全菜工程师小辉 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 服务器硬件的优化
  • MySQL数据库配置优化
  • CentOS系统针对mysql的参数优化
    • 内核相关参数(/etc/sysctl.conf)
      • 增加资源限制(/etc/security/limit.conf)
        • 磁盘调度策略
        • MySQL的参数配置
        • MySQL表结构与SQL优化
          • 索引优化规则
            • 1.使用最左前缀规则
            • 2.模糊查询不能利用索引(like '%XX'或者like '%XX%')
            • 3.不要过多创建索引
            • 4.索引长度尽量短
            • 5.索引更新不能频繁
            • 6.索引列不能参与计算
          • 查询时的优化
            • 小表驱动大表
            • 避免全表扫描
            • 避免mysql放弃索引查询
            • 使用覆盖索引,少使用select*
            • order by的索引生效
            • 不正确的使用导致索引失效
            • for update锁表
          • 其他优化
            • 开启慢查询
            • 实时获取有性能问题的SQL
            • 垂直分割
            • 拆分执行时间长的DELETE或INSERT语句
        相关产品与服务
        云数据库 SQL Server
        腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档