用Python测试InnoDB和MyISAM的读写性能

数据科学俱乐部

中国数据科学家社区

本文测试所用工具版本如下:

MySQL:5.7.18 Python:3.6 Pandas:0.23

一、创建数据表

首先我们需要把两张使用了不同引擎的表创建出来,使用为了方便起见,我们直接使用Navicat创建了两张 员工信息表,具体字段如下:

使用InnoDB引擎的表,设计表名为innodb,选项如下:

使用MyISAM引擎的表,设计表名为myisam,选项如下:

因为是简单操作,创建的具体细节就不详述了,至此,我们的数据库就把使用 InnoDB 和 MyISAM 两种引擎的表创建好了。

二、单线程写入性能对比

1、InnoDB 引擎

执行以下代码,往使用了InnoDB引擎的表格插入1000条数据

import pandas as pd
from sqlalchemy import create_engine
import time

db = create_engine('mysql+pymysql://mysql:123456@127.0.0.1:3306/test')
start = time.time()

for i in range(1000):
    data = {'index': i,
            'name': 'name_' + str(i),
            'age': i,
            'salary': i,
            'level': i}
    df = pd.DataFrame(data, index=[0])
    df.to_sql('innodb', db, if_exists='append', index=False)

end = time.time()
print(end - start)

执行3次上面的代码,得到程序写入1000条数据的时间分别为:12.58s、14.10s、12.71s,平均写入时间为 13.13s。

2、MyISAM 引擎

执行以下代码,往使用了MyISAM引擎的表格插入1000条数据

import pandas as pd
from sqlalchemy import create_engine
import time

db = create_engine('mysql+pymysql://mysql:123456@127.0.0.1:3306/test')
start = time.time()

for i in range(1000):
    data = {'index': i,
            'name': 'name_' + str(i),
            'age': i,
            'salary': i,
            'level': i}
    df = pd.DataFrame(data, index=[0])
    df.to_sql('myisam', db, if_exists='append', index=False)

end = time.time()
print(end - start)

执行3次上面的代码,得到程序写入1000条数据的时间分别为:6.64s、6.99s、7.29s,平均写入时间为 6.97s。

两种引擎的单线程写入速度对比如下:

结论:单线程的情况下,MyISAM引擎的写入速度比InnoDB引擎的写入速度快88%

三、多线程写入性能对比

1、InnoDB 引擎

执行以下代码,往使用了InnoDB引擎的表格插入1000条数据

importandas as pd
from sqlalchemy import create_engine
import time
from concurrent.futures import ThreadPoolExecutor

db = create_engine('mysql+pymysql://mysql:123456@127.0.0.1:3306/test')
start = time.time()

data_lst = [{'index': i,
             'name': 'name_' + str(i),
             'age': i,
             'salary': i,
             'level': i} for i in range(1000)]

def write(data):
    df = pd.DataFrame(data, index=[0])
    df.to_sql('innodb', db, if_exists='append', index=False)

def execute():
    with ThreadPoolExecutor(max_workers=5) as executor:
        executor.map(write, data_lst)

execute()

end = time.time()
print(end - start)

执行3次上面的代码,得到程序写入1000条数据的时间分别为:4.98s、4.84s、4.88s,平均写入时间为 4.9s。

2、MyISAM 引擎

执行以下代码,往使用了MyISAM引擎的表格插入1000条数据

importendas as pd
from sqlalchemy import create_engine
import time
from concurrent.futures import ThreadPoolExecutor

db = create_engine('mysql+pymysql://mysql:123456@127.0.0.1:3306/test')
start = time.time()

data_lst = [{'index': i,
             'name': 'name_' + str(i),
             'age': i,
             'salary': i,
             'level': i} for i in range(1000)]

def write(data):
    df = pd.DataFrame(data, index=[0])
    df.to_sql('myisam', db, if_exists='append', index=False)

def execute():
    with ThreadPoolExecutor(max_workers=5) as executor:
        executor.map(write, data_lst)

execute()

end = time.time()
print(end - start)

执行3次上面的代码,得到程序写入1000条数据的时间分别为:3.29s、3.62s、3.47s,平均写入时间为 3.46s。

两种引擎的多线程写入速度对比如下:

结论:多线程的情况下,MyISAM引擎的写入速度比InnoDB引擎的写入速度快42%

四、读取性能对比

为了获得数据量较大的表用于测试数据库的读取性能,我们循环执行10遍上面多线程写入数据的操作,得到两张数据量为10000条数据的表格,然后读取10遍该表格,获取读取时间

1、InnoDB 引擎

执行以下代码,读取10遍使用了InnoDB引擎的表格

import pandas as pd
from sqlalchemy import create_engine
import time

db = create_engine('mysql+pymysql://mysql:123456@127.0.0.1:3306/test')
start = time.time()

for _ in range(10):
    df = pd.read_sql('innodb', db)

end = time.time()
print(end - start)

执行3次上面的代码,得到程序10次读取10000条数据的时间分别为:28.94s、28.88s、28.48s,平均写入时间为 28.77s。

2、MyISAM 引擎

执行以下代码,读取10遍使用了MyISAM引擎的表格

import pandas as pd
from sqlalchemy import create_engine
import time

db = create_engine('mysql+pymysql://mysql:123456@127.0.0.1:3306/test')
start = time.time()

for _ in range(10):
    df = pd.read_sql('innodb', db)

end = time.time()
print(end - start)

执行3次上面的代码,得到程序10次读取10000条数据的时间分别为:28.51s、29.12s、28.76s,平均写入时间为 28.8s。

两种引擎的读取速度对比如下:

结论:MyISAM引擎和InnoDB引擎的读取速度无明显差异

五、总结

1、写入速度,MyISAM比InnoDB快,单线程的情况下,两者差异尤为明显

2、读取速度,InnoDB和MyISAM无明显差异

原文发布于微信公众号 - Python中文社区(python-china)

原文发表时间:2018-10-12

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏深度学习之tensorflow实战篇

mysql几种存储引擎介绍

前言 在数据库中存的就是一张张有着千丝万缕关系的表,所以表设计的好坏,将直接影响着整个数据库。而在设计表的时候,我们都会关注一个问题,使用什么存储引擎。等一下...

30140
来自专栏沃趣科技

使用pg_stat_statement监控pgsql遇到的问题

pg_stat_statements是PG中监控数据库活动的重要插件,通过它可以获得SQL的统计信息,例如该SQL被调用了多少次,返回了多少记录,在读写数据上...

39550
来自专栏熊二哥

MySQL快速入门

一直说要好好复习一下Mysql都木有时间,终于赶上最近新购买了阿里云,决定使用CentOS去试试.NET Core等相关的开发,于是决定好好的回顾下这部分知识,...

28470
来自专栏java工会

我们为何对MySQL 8.0的到来感到兴奋!

23930
来自专栏Java面试通关手册

关于MySQL的知识点与面试常见问题都在这里

我自己总结的Java学习的一些知识点以及面试问题,目前已经开源,会一直完善下去,欢迎建议和指导欢迎Star: https://github.com/Snailc...

22230
来自专栏MySQL实战分享

MongoDB 第五期 : 托管 MongoDB 操作指南

本文从自动化部署工具的介绍开始,从四点介绍了MongoDB的部署流程,并从结构、采集部署配置、日报及数据库表结构介绍了MongoDB的监控,以及从策略、状态查询...

51230
来自专栏扎心了老铁

Elasticsearch索引别名、Filtered索引别名、Template

在使用elasticsearch的时候,经常会遇到需要淘汰掉历史数据的场景。 为了方便数据淘汰,并使得数据管理更加灵活,我们经常会以时间为粒度建立索引,例如: ...

49250
来自专栏Java架构师历程

MySQL的三大引擎

InnoDB和MyISAM是在使用MySQL最常用的两个表类型,各有优缺点,视具体应用而定。基本 的差别为:

2K20
来自专栏PHP在线

MySQL存储引擎总结

前言 在数据库中存的就是一张张有着千丝万缕关系的表,所以表设计的好坏,将直接影响着整个数据库。而在设计表的时候,我们都会关注一个问题,使用什么存储引擎。等一下,...

42660
来自专栏恒恒的专栏

swoole+php搭建高性能脚本服务

后台服务的业务逻辑中,或多或少需要一些异步去处理的脚本逻辑,例如业务的统计、上报、数据运算,定时监控等等。实现的方法也有很多,用linux自带的c...

31510

扫码关注云+社区

领取腾讯云代金券