前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >《Spring设计思想-事务篇》1.数据库连接和Java线程的关系

《Spring设计思想-事务篇》1.数据库连接和Java线程的关系

作者头像
亦山
发布2019-06-05 17:09:13
2.2K1
发布2019-06-05 17:09:13
举报

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://cloud.tencent.com/developer/article/1442786

0. 前言

Spring作为Java框架王者,当前已经是基础容器框架的实际标准。Spring 除了提供了 IoCAOP特性外,还有一个极其核心和重要的特性:数据库事务。事务管理涉及到的技术点比较多,想完全理解需要花费一定的时间,本系列《Spring设计思想-事务篇》将通过如下几个方面来阐述Spring的数据库事务

  • 数据库连接java.sql.Connection的特性、事务表示、以及和Java线程之间的天然关系;
  • 数据库的隔离级别和传播机制
  • Spring 基于事务和连接池的抽象和设计
  • Spring 事务的实现原理

而本文作为**《Spring设计思想-事务篇》** 的开篇,将深入数据库连接 (java.sql.Connection对象)的特性,事务表示,以及和Java线程之间的天然关系。懂得了底层的基本原理,在这些基础的概念之上再来理解Spring 事务,就会容易很多。


1. Java事务控制的基本单位 : java.sql.Conection

在Java中,使用了java.sql.Connection实例来表示和数据库的一个连接,通信的方式目前基本上采用的是TCP/IP 连接方式。通过对Connection进行一系列的事务控制。

可能有人有如下的想法: 既然java.sql.Connection可以完成事务操作,那我在写代码的时候,直接创建一个然后使用不就行了? 然而在事实上,我们并不能这么做,这是因为,java.sql.Connection和数据库之间有非常紧密的关系,其数据库的资源是很有限的。

1.1 java.sql.Connection-有限的系统资源

应用程序和数据库之间建立 Connection连接,则数据库机器会为之分配一定的线程资源来维护这种连接,连接数越多,消耗数据库的线程资源也就越多;另外不同的connection实例之间,可能会操作相同的表数据,也就是高并发,为了支持数据库对ACID特性的支持,数据库又会牺牲更多的资源。简单地来说,建立Connection连接,会消耗数据库系统的如下资源:

资源

说明

线程数

线程越多,线程的上下文切换会越频繁,会影响其处理能力

创建Connection的开销

由于Connection负责和数据库之间的通信,在创建环节会做大量的初始化 ,创建过程所需时间和内存资源上都有一定的开销

内存资源

为了维护Connection对象会消耗一定的内存

锁占用

在高并发模式下,不同的Connection可能会操作相同的表数据,就会存在锁的情况,数据库为了维护这种锁会有不少的内存开销

上述的几种资源会限制数据库的链接数和处理性能。

结论: 数据库资源是比较宝贵的有限资源,当应用程序有数据库连接需求过大时,很容易会达到数据库的连接并发瓶颈。 关于创建Connection过程的开销,可以参考 《深入理解mybatis原理》 Mybatis数据源与连接池 第五节 “为什么要使用连接池?”

1.2 数据库最多支持多少Connection连接?

以 MYSQL为例,可以通过如下语句查询数据库的最大支持情况:

代码语言:javascript
复制
-- 查看当前数据库最多支持多少数据库连接
show variables like '%max_connections%';
-- 设置当前运行时mysql的最大连接数,服务重启连接数将还原
set GLOBAL max_connections = 200;
-- 修改 my.ini 或者my.cnf 配置文件
max_connections = 200;

数据库的连接数设置的越大越好吗? 肯定不是的,连接数越大,对使用大量的线程维护,伴随着大量的线程上下文切换,并且与此同时,连接数越多,表数据锁使用的概率会更大,反而会导致整体数据库的性能下降。具体的设置范围,应当具体的业务背景来调优。


2. java.sql.Connection对象本身的特性— 线性操作和可以不限次数执行SQL事务操作

java.sql.Connection 本身有如下两个比较关键的特性:


  • 线性操作:即在操作的时序上,事务和事务之间的执行是线性排开依次执行的
  • 当建立了 java.sql.Connection 连接后,可以不限次数执行事务SQL请求 由于Connection对象的通信值基于TCP/IP协议的,当初始化后在手动关闭之前和数据库保持心跳存活连接,所以,可以使用Connection对象执行不限次数的SQL语句请求,包括事务请求 注意!! 这个看似比较简单的表述,在实际使用过程中非常重要,数据库连接池就是基于此特性建立的

如下图所示:

有上图所示,对于java.sql.Connection对象的操作,一般会遵循序列化的事务操作模式,即:一个新事务的开启,必须在上一个事务完成之后(如果存在的话);换成另外一种表述方式就是:对connection的操作必须是线性的。

3. 如何在Java中实现对java.sql.Connection对象的线性操作?

3.1. 一个线程的整个生命周期中,可以独占一个java.sql.Connection 连接吗?

Java中,当然一个线程可以在整个生命周期独占一个java.sql.Connection,使用该对象完成各种数据库操作,因为一个线程内的所有操作都是同步的和线性的。然而,在实际的项目中,并不会这样做,原因有两个:

  • Java中的线程数量可能远超数据库连接数量,会出现**僧多粥少**的情况 如上面章节1.2中提到的,一个MYSQL服务器的最大连接数量是有上限的,例子中提到的就是上限200;而在稍微大型一点的Java WEB项目中,光用户的HTTP请求线程数,就不止200个,这样就会出现部分线程无法获取到数据库连接,进而无法完成业务操作。
  • Java线程在工作过程中,真正访问**JDBC数据库连接**所占用的时间比例很短 线程在接收到用户请求后,有很多业务逻辑需要处理:比如参数校验权限验证数值计算,然后持久化结果;其中可能只有持久化结果环节需要访问JDBC数据库连接,其余的时间范围内,JDBC数据库连接 都是空闲状态。换言之,如果线程整个生命周期中独占JDBC数据库连接,那么,真个连接池的空闲率很高,使用率很低。 综上所述,Java线程和JDBC数据库连接的关系如下:

结论: 结合上述的两个症结,为了提高JDBC数据库连接的使用效率,目前普遍的解决方案是:当线程需要做数据库操作时,才会真正请求获取**JDBC数据库连接**,线程使用完了之后,立即释放,被释放的**JDBC数据库连接**等待下次分配使用 基于这个结论,会衍生两个问题需要解决:

  • Java多线程访问同一个java.sql.Connection会有什么问题?如何解决?
  • JDBC数据库连接 如何管理和分配?(这个解决方案是:连接池,后面章节会详细阐述)

通过上述的图示中,可以看到,一个**数据库连接对象**,在线程进行事务操作时,线程在此期间内是独占**数据库连接对象**的,也就是说,在事务进行期间,有一个非常重要的特性,就是:**数据库连接对象**可以吸附在**线程**上,我把这种特性称之为**事务对象的线程吸附性** 这种特性,正是由于这种特性,在Spring实现上,使用了基于线程的**ThreadLocal**来表示这种线程依附行为


3.1 Java多线程访问同一个java.sql.Connection会有什么问题?

Java多线程访问同一个java.sql.Connection会导致事务错乱。例如:现有线程thread #1 和线程thread #2,两个线程会有如下数据库操作:

thread #1: update xxx; update yyy; commit; thread #2: delete zzz; insert ttt; rollback; 语句执行的序列在connection对象上,可能表现成了: delete zzz; update xxx; insert ttt; rollback; update yyy; commit;

有上图可以看到,Thread #1的请求 update xxx 被thread #2回退掉,导致语句丢失,thread #1的事务不完整

3.2 Java多线程访问同一个java.sql.Connection 的原则

解决上述事务不完整的问题,从本质上而言,就是多线程访互斥资源的方法。多线程互斥访问资源的方式在Java中的实现方式有很多,如下使用有一个最简单的使用 synchronized 关键字来实现 :

代码语言:javascript
复制
java.sql.Connection sharedConnection = <创建流程>
## thread #1 的业务伪代码:

synchronized(sharedConnection){
         `update xxx`;    
         `update yyy`;  
         `commit`;
}
## thread #2 的业务伪代码:

synchronized(sharedConnection){
       `delete zzz`;   
       `insert ttt`; 
       `rollback`;
}

上述的伪代码在执行上能够体现成如下的形式,即同一时间内,只有一个线程占用Connection对象。

假设Thread #2先获取到了Connection锁,如下图所示:

存在的问题 那上述的流程还有有点问题:假如 thread #2 在执行语句 delete zzz,insert ttt,rollback 的过程中,在insert ttt之前有一段业务代码抛出了异常,导致语句只执行到了 delete zzz,这会导致在connection对象上有一个尚未提交的delete zzz请求; 当thread #1拿到了connection 对象的锁之后,接着执行 update xxx; update yyy; commit; 即:在两个线程执行完了之后,对connection的操作为delete zzz; update xxx; update yyy; commit; 示例如下:

解决方案确保每个线程在使用Connection对象时,最终要明确对Connection做__commit 或者__rollback

调整后的伪代码如下所示:

代码语言:javascript
复制
java.sql.Connection sharedConnection = <创建流程>
## thread #1 的业务伪代码:

synchronized(sharedConnection){
       try{
         ` update xxx`;    
         `update yyy`;  
         `commit`;
       } catch(Exception e){
          `rollback`; //之所以rollback ,是确保在执行事务的过程中,在connection对象上,清空尚未提交的所有SQL语句
      }
}
## thread #2 的业务伪代码:

synchronized(sharedConnection){
       try{
       `delete zzz`;   
       `insert ttt`; 
       `rollback`;
       } catch(Exception e){
          `rollback`; //之所以rollback ,是确保在执行事务的过程中,在connection对象上,清空尚未提交的所有SQL语句
      }
}

综上所述,解决多个线程访问同一个Connection对象时,必须遵循两个基本原则:

  • 以资源互斥的方式访问**Connection**对象
  • 在线程执行结束时,应当最终及时提交(**commit**)或回滚(**rollback**)对**Connection**的影响;不允许存在尚未被提交或者回滚的语句

4. 当一个事务结束,java.sql.Connection实例有必要释放销毁吗?

正常情况下,我们在写业务代码时,会有类似的流程:

  1. 创建一个java.sql.Connection实例;
  2. 基于java.sql.Connection 做相关事务提交操作
  3. 销毁java.sql.Connection 实例

而实际上,在第三步骤,是完全没有必要销毁java.sql.Connection 实例的,这是因为,在第二章节我们介绍的Connection的性质:当建立了 java.sql.Connection 连接后,可以不限次数执行事务SQL请求, 也就是说,当此次事务结束后,我可以紧接着使用这个Connection对象开启下一个事务。

另外,由于创建一个java.sql.Connection 实例的代价本身就比较大,笔者测试的数据库建立Connection的时间,一般都在至少0.1s级别,如果每一个事务在执行的时候,都要花费额外的0.1s 来做连接,会严重影响当前服务的性能和吞吐量。

结合上面的叙述,目前的做法,在完成事务后,并不会销毁java.sql.Connection实例,而是将其回收到连接池中。


5. 连接池 ---- 统一管理java.sql.Connection的容器

一般连接池需要如下几个功能:

  1. 管理一批Connection对象,一般会有连接数上限设置;
  2. 为每一个获取Connection请求做资源分配;如果资源不足,设置等待时间
  3. 根据实际Connection的使用情况,为了提高系统之间的利用率,动态调整连接池中Connection对象的数量,如应用实际使用的连接数比较少时,会自动关闭掉一些处于无用状态的连接;当请求量大的时候,再动态创建。

目前比较流行的几个连接池解决方案有:HikariCP, 阿里的Druid, apache的DBCP等,具体的实现不是本文的重点,有兴趣的同学可以研究下。


6.结语

本文对最基本的数据库连接和线程之间的关系进行了探讨,以及数据库连接的管理-**连接池的角色和职能进行了概括。本文没有复杂的概念陈述和实现介绍,是希望读者脑海里对数据库事务的jdbc表示对象java.sql.Connection对象有一个清晰的认知,方便后续更复杂的Spring事务原理的详细介绍。

接下来的几篇,将会开始细化,具体话题如下:

  • 数据库的隔离级别和传播机制
  • Spring 基于事务和连接池的抽象和设计
  • Spring 事务的实现原理

有兴趣的同学可以持续关注,或者有感兴趣的话题可以抛出来,一起探讨。


作者声明

如需转载,请注明出处,亦山札记 https://blog.csdn.net/luanlouis

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019年06月03日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 0. 前言
  • 1. Java事务控制的基本单位 : java.sql.Conection
    • 1.1 java.sql.Connection-有限的系统资源
      • 1.2 数据库最多支持多少Connection连接?
      • 2. java.sql.Connection对象本身的特性— 线性操作和可以不限次数执行SQL事务操作
      • 3. 如何在Java中实现对java.sql.Connection对象的线性操作?
      • 3.1. 一个线程的整个生命周期中,可以独占一个java.sql.Connection 连接吗?
        • 3.1 Java多线程访问同一个java.sql.Connection会有什么问题?
          • 3.2 Java多线程访问同一个java.sql.Connection 的原则
          • 4. 当一个事务结束,java.sql.Connection实例有必要释放销毁吗?
          • 5. 连接池 ---- 统一管理java.sql.Connection的容器
          • 6.结语
          相关产品与服务
          数据库
          云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档