前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >100w条数据 | 插入Mysql你要用多长时间?

100w条数据 | 插入Mysql你要用多长时间?

作者头像
王知无-import_bigdata
发布2019-11-07 02:21:17
2.2K0
发布2019-11-07 02:21:17
举报

目录

1、多线程插入(单表) 2、多线程插入(多表) 3、预处理SQL 4、多值插入SQL 5、事务(N条提交一次)

多线程插入(单表)

问:为何对同一个表的插入多线程会比单线程快?同一时间对一个表的写操作不应该是独占的吗?

答:在数据里做插入操作的时候,整体时间的分配是这样的:

1、多链接耗时 (30%)

2、多发送query到服务器 (20%)

3、多解析query (20%)

4、多插入操作 (10% * 词条数目)

5、多插入index (10% * Index的数目)

6、多关闭链接 (10%)

从这里可以看出来,真正耗时的不是操作,而是链接,解析的过程。

MySQL插入数据在写阶段是独占的,但是插入一条数据仍然需要解析、计算、最后才进行写处理,比如要给每一条记录分配自增id,校验主键唯一键属性,或者其他一些逻辑处理,都是需要计算的,所以说多线程能够提高效率。

多线程插入(多表)

分区分表后使用多线程插入。

预处理SQL

普通SQL:即使用Statement接口执行SQL

预处理SQL:即使用PreparedStatement接口执行SQL

使用PreparedStatement接口允许数据库预编译SQL语句,以后只需传入参数,避免了数据库每次都编译SQL语句,因此性能更好。

代码语言:javascript
复制
String sql = "insert into testdb.tuser (name, remark, createtime, updatetime) values (?, ?, ?, ?)";
for(int i = 0; i < m; i++) {
//从池中获取连接
Connection conn = myBroker.getConnection();
PreparedStatement pstmt = conn.prepareStatement(sql);
for(int k = 0; k < n; k++) {
        pstmt.setString(1, RandomToolkit.generateString(12));
        pstmt.setString(2, RandomToolkit.generateString(24));
        pstmt.setDate(3, newDate(System.currentTimeMillis()));
        pstmt.setDate(4, newDate(System.currentTimeMillis()));
//加入批处理
        pstmt.addBatch();
}
    pstmt.executeBatch(); //执行批处理
    pstmt.close();
    myBroker.freeConnection(conn); //连接归池
}

多值插入SQL

普通插入SQL:INSERT INTO TBL_TEST (id) VALUES(1)

多值插入SQL:INSERT INTO TBL_TEST (id) VALUES (1), (2), (3)

使用多值插入SQL,SQL语句的总长度减少,即减少了网络IO,同时也降低了连接次数,数据库一次SQL解析,能够插入多条数据。

事务(N条提交一次)

在一个事务中提交大量INSERT语句可以提高性能。

1、将表的存储引擎修改为myisam 2、将 sql 拼接成字符串,每 1000 条左右提交事务。

  • 执行多条SQL语句,实现数据库事务。
  • mysql数据库
  • 多条SQL语句
代码语言:javascript
复制
public void ExecuteSqlTran(List<string> SQLStringList)
{
 using (MySqlConnection conn = new MySqlConnection(connectionString))
    {
 if (DBVariable.flag)
        {
            conn.Open();
 MySqlCommand cmd = new MySqlCommand();
            cmd.Connection = conn;
 MySqlTransaction tx = conn.BeginTransaction();
            cmd.Transaction = tx;
 try
            {
 for (int n = 0; n < SQLStringList.Count; n++)
                {
 string strsql = SQLStringList[n].ToString();
 if (strsql.Trim().Length > 1)
                    {
                        cmd.CommandText = strsql;
                        cmd.ExecuteNonQuery();
                    }
 //后来加上的  
 if (n > 0 && (n % 1000 == 0 || n == SQLStringList.Count - 1))
                    {
                        tx.Commit();
                        tx = conn.BeginTransaction();
                    }
                }
 //tx.Commit();//原来一次性提交  
            }
 catch (System.Data.SqlClient.SqlException E)
            {
                tx.Rollback();
 throw new Exception(E.Message);
            }
        }
    }
}

10w条数据大概用时10s!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据技术与架构 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 目录
    • 多线程插入(单表)
      • 多线程插入(多表)
        • 预处理SQL
          • 多值插入SQL
            • 事务(N条提交一次)
            相关产品与服务
            云数据库 SQL Server
            腾讯云数据库 SQL Server (TencentDB for SQL Server)是业界最常用的商用数据库之一,对基于 Windows 架构的应用程序具有完美的支持。TencentDB for SQL Server 拥有微软正版授权,可持续为用户提供最新的功能,避免未授权使用软件的风险。具有即开即用、稳定可靠、安全运行、弹性扩缩等特点。
            领券
            问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档