方法网站目录,做网站怎样备案,wordpress 多域名插件,凡客诚品为什么失败存储引擎
Mysql体系结构
1). 连接层
最上层是一些客户端和链接服务#xff0c;包含本地sock 通信和大多数基于客户端/服务端工具实现的类似于TCP/IP的通信。主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程池的概念#xff0c;为通过认证安全…存储引擎
Mysql体系结构
1). 连接层
最上层是一些客户端和链接服务包含本地sock 通信和大多数基于客户端/服务端工具实现的类似于TCP/IP的通信。主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程池的概念为通过认证安全接入的客户端提供线程。同样在该层上可以实现基于SSL的安全链接。服务器也会为安全接入的每个客户端验证它所具有的操作权限。
2). 服务层
第二层架构主要完成大多数的核心服务功能如SQL接口并完成缓存的查询SQL的分析和优化部分内置函数的执行。所有跨存储引擎的功能也在这一层实现如 过程、函数等。在该层服务器会解析查询并创建相应的内部解析树并对其完成相应的优化如确定表的查询的顺序是否利用索引等最后生成相应的执行操作。如果是select语句服务器还会查询内部的缓存如果缓存空间足够大这样在解决大量读操作的环境中能够很好的提升系统的性能。
3). 引擎层
存储引擎层 存储引擎真正的负责了MySQL中数据的存储和提取服务器通过API和存储引擎进行通信。不同的存储引擎具有不同的功能这样我们可以根据自己的需要来选取合适的存储引擎。数据库中的索引是在存储引擎层实现的。
4). 存储层
数据存储层 主要是将数据(如: redolog、undolog、数据、索引、二进制日志、错误日志、查询日志、慢查询日志等)存储在文件系统之上并完成与存储引擎的交互。
和其他数据库相比MySQL有点与众不同它的架构可以在多种不同场景中应用并发挥良好作用。主要体现在存储引擎上插件式的存储引擎架构将查询处理和其他的系统任务以及数据的存储提取分离。这种架构可以根据业务的需求和实际需要选择合适的存储引擎。存储引擎的介绍
存储引擎就是存储数据、建立索引、更新/查询数据等技术的实现方式 。存储引擎是基于表的而不是基于库的所以存储引擎也可被称为表类型。我们可以在创建表的时候来指定选择的存储引擎如果没有指定将自动选择默认的存储引擎。
建表时指定存储引擎
mysql默认的存储引擎是InnoDB
CREATE TABLE 表名(
字段1 字段1类型 [ COMMENT 字段1注释 ] ,
......
字段n 字段n类型 [COMMENT 字段n注释 ]
) ENGINE INNODB [ COMMENT 表注释 ] ;查询当前数据库支持的存储引擎
show engines;存储引擎的特点
介绍重点提到的三种存储引擎 InnoDB、MyISAM、Memory的特点。
InnoDB
1). 介绍
InnoDB是一种兼顾高可靠性和高性能的通用存储引擎在 MySQL 5.5 之后InnoDB是默认的MySQL 存储引擎。
2). 特点
DML操作遵循ACID模型支持事务行级锁提高并发访问性能支持外键FOREIGN KEY约束保证数据的完整性和正确性
从
3). 文件
xxx.ibdxxx代表的是表名innoDB引擎的每张表都会对应这样一个表空间文件存储该表的表结构frm-早期的 、sdi-新版的、数据和索引。
InnoDB 存储引擎的表存储方式
文件存储 表结构存储在 .frm 文件早期版本或 .sdi 文件新版中。数据和索引存储在 .ibd 文件中。 表空间 InnoDB 存储引擎支持两种表空间模式 独立表空间Per-Table Tablespaces每个表都有一个独立的 .ibd 文件。这种方式的优点是表数据和索引独立存储便于备份和恢复。共享表空间Shared Tablespaces所有表的数据和索引存储在同一个表空间文件中如 ibdata1。这种方式在早期版本中比较常见但独立表空间是现代推荐的方式。
参数innodb_file_per_table
show variables like innodb_file_per_table;如果该参数开启代表对于InnoDB引擎的表每一张表都对应一个ibd文件。
每一个ibd文件就对应一张表比如我们有一张表 account就有这样的一个account.ibd文件而在这个ibd文件中不仅存放表结构、数据还会存放该表对应的索引信息。 而该文件是基于二进制存储的不能直接基于记事本打开我们可以使用mysql提供的一个指令 ibd2sdi 通过该指令就可以从ibd文件中提取sdi信息而sdi数据字典信息中就包含该表的表结构
ibd2sdi account.ibd4). 逻辑存储结构
表空间 : InnoDB存储引擎逻辑结构的最高层ibd文件其实就是表空间文件在表空间中可以包含多个Segment段。
段 : 表空间是由各个段组成的 常见的段有数据段、索引段、回滚段等。InnoDB中对于段的管理都是引擎自身完成不需要人为对其控制一个段中包含多个区。
区 : 区是表空间的单元结构每个区的大小为1M。 默认情况下 InnoDB存储引擎页大小为16K 即一个区中一共有64个连续的页。
页 : 页是组成区的最小单元页也是****InnoDB 存储引擎磁盘管理的最小单元每个页的大小默认为 16KB。为了保证页的连续性InnoDB 存储引擎每次从磁盘申请 4-5 个区。
行 : InnoDB 存储引擎是面向行的也就是说数据是按行进行存放的在每一行中除了定义表时所指定的字段以外还包含两个隐藏字段(后面会详细介绍)。
MyISAM
1). 介绍
MyISAM是MySQL早期的默认存储引擎。
2). 特点
不支持事务不支持外键
支持表锁不支持行锁
访问速度快
3). 文件
xxx.sdi存储表结构信息
xxx.MYD: 存储数据
xxx.MYI: 存储索引
Memory
1). 介绍
Memory引擎的表数据时存储在内存中的由于受到硬件问题、或断电问题的影响只能将这些表作为临时表或缓存使用。
2). 特点
内存存放
hash索引默认
3).文件
xxx.sdi存储表结构信息
数据和索引都存储在内存中不依赖于任何磁盘文件。
存储限制
InnoDB适合需要大表和事务支持的场景单表最大支持 64TB。MyISAM适合读多写少的场景表大小受限于文件系统和操作系统。Memory适合临时数据和高速缓存场景表大小受限于服务器内存。
面试题:
InnoDB引擎与MyISAM引擎的区别 ?
①. InnoDB引擎, 支持事务, 而MyISAM不支持。
②. InnoDB引擎, 支持行锁和表锁, 而MyISAM仅支持表锁, 不支持行锁。
③. InnoDB引擎, 支持外键, 而MyISAM是不支持的。
主要是上述三点区别当然也可以从索引结构、存储限制等方面更加深入的回答具体参考如下官方文档
https://dev.mysql.com/doc/refman/8.0/en/innodb-introduction.html
https://dev.mysql.com/doc/refman/8.0/en/myisam-storage-engine.html存储引擎的选择
在选择存储引擎时应该根据应用系统的特点选择合适的存储引擎。对于复杂的应用系统还可以根据实际情况选择多种存储引擎进行组合。
InnoDB: 是Mysql的默认存储引擎支持事务、外键。如果应用对事务的完整性有比较高的要求在并发条件下要求数据的一致性数据操作除了插入和查询之外还包含很多的更新、删除操作那么InnoDB存储引擎是比较合适的选择。
MyISAM 如果应用是以读操作和插入操作为主只有很少的更新和删除操作并且对事务的完整性、并发性要求不是很高那么选择这个存储引擎是非常合适的。
MEMORY将所有数据保存在内存中访问速度快通常用于临时表及缓存。MEMORY的缺陷就是对表的大小有限制太大的表无法缓存在内存中而且无法保障数据的安全性。
索引
索引index是帮助MySQL高效获取数据的数据结构(有序)。在数据之外数据库系统还维护着满足特定查找算法的数据结构这些数据结构以某种方式引用指向数据 这样就可以在这些数据结构上实现高级查找算法这种数据结构就是索引。
1). 无索引情况
在无索引情况下就需要从第一行开始扫描一直扫描到最后一行我们称之为 全表扫描性能很低。
2). 有索引情况
如果我们针对于这张表建立了索引假设索引结构就是二叉树那么也就意味着会对age这个字段建立一个二叉树的索引结构。
此时我们在进行查询时只需要扫描三次就可以找到数据了极大的提高的查询的效率。
备注 这里我们只是假设索引的结构是二叉树介绍一下索引的大概原理只是一个示意图并
不是索引的真实结构索引的真实结构后面会详细介绍。索引结构
二叉树
如果选择二叉树作为索引结构会存在以下缺点
顺序插入时会形成一个链表查询性能大大降低。大数据量情况下层级较深检索速度慢。
红黑树是一颗自平衡二叉树那这样即使是顺序插入数据最终形成的数据结构也是一颗平衡的二叉树,由于红黑树也是一颗二叉树所以也会存在一个缺点
大数据量情况下层级较深检索速度慢。
B-树B树
B-TreeB树是一种多路平衡查找树相对于二叉树B树每个节点可以有多个分支即多叉。
以一颗最大度数max-degree为5(5阶)的b-tree为例那这个B树每个节点最多存储4个key5个指针
知识小贴士: 树的度数指的是一个节点的子节点个数。特点
5阶的B树每一个节点最多存储4个key对应5个指针。一旦节点存储的key数量到达5就会裂变中间元素向上分裂。在B树中非叶子节点和叶子节点都会存放数据。
BTree 与 B-Tree相比主要有以下三点区别
所有的数据都会出现在叶子节点。叶子节点形成一个单向链表。非叶子节点仅仅起到索引数据作用具体的数据都是在叶子节点存放的
上述我们所看到的结构是标准的BTree的数据结构接下来我们再来看看MySQL中优化之后的BTree。
MySQL索引数据结构对经典的BTree进行了优化。在原BTree的基础上增加一个指向相邻叶子节点的链表指针就形成了带有顺序指针的BTree提高区间访问的性能利于排序。
Hash
1). 结构
哈希索引就是采用一定的hash算法将键值换算成新的hash值映射到对应的槽位上然后存储在hash表中。
如果两个(或多个)键值映射到一个相同的槽位上他们就产生了hash冲突也称为hash碰撞可以通过链表来解决。
2). 特点 Hash索引只能用于对等比较(in)不支持范围查询between … 无法利用索引完成排序操作 查询效率高通常(不存在hash冲突的情况)只需要一次检索就可以了效率通常要高于Btree索引
3). 存储引擎支持
在MySQL中支持hash索引的是Memory存储引擎。 而InnoDB中具有自适应hash功能hash索引是InnoDB存储引擎根据BTree索引在指定条件下自动构建的。
思考题 为什么InnoDB存储引擎选择使用Btree索引结构?
-- 1:相对于二叉树层级更少搜索效率高
-- 2:对于B-tree无论是叶子节点还是非叶子节点都会保存数据这样导致一页中存储的键值减少指针跟着减少要同样保存大量数据只能增加树的高度导致性能降低
-- 3:相对Hash索引Btree支持范围匹配及排序操作索引分类
在MySQL数据库将索引的具体类型主要分为以下几类主键索引、唯一索引、常规索引、全文索引。
聚集索引二级索引
在InnoDB存储引擎中根据索引的存储形式又可以分为以下两种
区别
特性/类型B树索引Hash 索引聚集索引二级索引数据结构多路平衡查找树哈希表特殊的B树数据存储在叶子节点B树叶子节点存储指针是否有序是否是物理顺序是逻辑顺序支持操作范围查询、排序等值查询范围查询、排序范围查询、排序查询效率O(log n)O(1)O(log n)范围查询快O(log n)需两次查找插入/删除效率较高高等值操作较低可能需要重新排序较高适用场景多列查询、范围查询高频等值查询需要物理顺序的场景多列查询、辅助查询存储方式独立索引独立索引数据与索引一体索引与数据分离数量限制无限制无限制一个表只能有一个一个表可以有多个
B树索引和聚集索引的关系
B树索引是一种数据结构用于实现索引。聚集索引是一种索引分类方式定义了数据在物理存储上的顺序。聚集索引的底层实现通常是B树但它的特点是数据存储在叶子节点上且数据的物理顺序与索引顺序一致。
聚集索引选取规则:
如果存在主键主键索引就是聚集索引。如果不存在主键将使用第一个唯一UNIQUE索引作为聚集索引。如果表没有主键或没有合适的唯一索引则InnoDB会自动生成一个rowid作为隐藏的聚集索引。
聚集索引和二级索引的具体结构如下
聚集索引的叶子节点下挂的是这一行的数据 。二级索引的叶子节点下挂的是该字段值对应的主键值。
具体过程
①. 由于是根据name字段进行查询所以先根据nameArm’到name字段的二级索引中进行匹配查找。但是在二级索引中只能查找到 Arm 对应的主键值 10。
②. 由于查询返回的数据是*所以此时还需要根据主键值10到聚集索引中查找10对应的记录最终找到10对应的行row。
③. 最终拿到这一行的数据直接返回即可。
回表查询 这种先到二级索引中查找数据找到主键值然后再到聚集索引中根据主键值获取数据的方式就称之为回表查询。思考题
1.以下两条SQL语句那个执行效率高? 为什么?
A. select * from user where id 10 ;
B. select * from user where name Arm ;
备注: id为主键name字段创建的有索引解答
A 语句的执行性能要高于B 语句。
因为A语句直接走聚集索引直接返回数据。 而B语句需要先查询name字段的二级索引然后再查询聚集索引也就是需要进行回表查询。InnoDB主键索引的Btree高度为多高呢?假设:
一行数据大小为1k一页中可以存储16行这样的数据。InnoDB的指针占用6个字节的空
间主键即使为bigint占用字节数为8。
高度为2
n * 8 (n 1) * 6 16*1024 , 算出n约为 1170
1171* 16 18736
也就是说如果树的高度为2则可以存储 18000 多条记录。
高度为3
1171 * 1171 * 16 21939856
也就是说如果树的高度为3则可以存储 2200w 左右的记录。索引语法
1). 创建索引
CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (index_col_name,... ) ;2). 查看索引
SHOW INDEX FROM table_name ;3). 删除索引
DROP INDEX index_name ON table_name ;上面的只对普通索引有效不包括主键索引
1主键索引的创建
表未创建的情况
CREATE TABLE emp (id INT PRIMARY KEY,name VARCHAR(50),position VARCHAR(50)
);表已创建的情况
ALTER TABLE emp ADD PRIMARY KEY (id);2)主键索引的删除
ALTER TABLE emp DROP PRIMARY KEY;SQL性能分析
SQL执行频率
MySQL 客户端连接成功后通过 show [session|global] status 命令可以提供服务器状态信息。
通过如下指令可以查看当前数据库的INSERT、UPDATE、DELETE、SELECT的访问频次
-- session 是查看当前会话 ;
-- global 是查询全局数据 ;
SHOW GLOBAL STATUS LIKE Com_______;(7个_)通过上述指令我们可以查看到当前数据库到底是以查询为主还是以增删改为主从而为数据库优化提供参考依据。 如果是以增删改为主我们可以考虑不对其进行索引的优化。 如果是以查询为主那么就要考虑对数据库的索引进行优化了。慢查询日志
慢查询日志记录了所有执行时间超过指定参数long_query_time单位秒默认10秒的所有SQL语句的日志。
MySQL的慢查询日志默认没有开启我们可以查看一下系统变量 slow_query_log。
show variables like slow_query_log;如果要开启慢查询日志需要在MySQL的配置文件/etc/my.cnf中配置如下信息
# 开启MySQL慢日志查询开关
slow_query_log1
# 设置慢日志的时间为2秒SQL语句执行时间超过2秒就会视为慢查询记录慢查询日志
long_query_time2配置完毕之后通过以下指令重新启动MySQL服务器进行测试查看慢日志文件中记录的信息
/var/lib/mysql/localhost-slow.log。
systemctl restart mysqld最终我们发现在慢查询日志中只会记录执行时间超多我们预设时间2s的SQL执行较快的SQL是不会记录的。
那这样通过慢查询日志就可以定位出执行效率比较低的SQL从而有针对性的进行优化。
profile详情
show profiles 能够在做SQL优化时帮助我们了解时间都耗费到哪里去了。通过have_profiling参数能够看到当前MySQL是否支持profile操作
-- 能够看当前mysql是否支持profile操作
SELECT have_profiling ;-- 能够看当前profile的开关是否打开
select profiling;可以通过set语句在session/global级别开启profiling
set profiling1;当profiling 的开关打开时我们所执行的SQL语句都会被MySQL记录并记录执行时间消耗到哪儿去了。
explain 执行计划
EXPLAIN 或者 DESC命令获取 MySQL 如何执行 SELECT 语句的信息包括在 SELECT 语句执行过程中表如何连接和连接的顺序。
语法
-- 直接在select语句之前加上关键字 explain / desc
EXPLAIN SELECT 字段列表 FROM 表名 WHERE 条件 ;索引使用
最左前缀法则
如果索引了多列联合索引要遵守最左前缀法则。最左前缀法则指的是查询从索引的最左列开始并且不跳过索引中的列。如果跳跃某一列索引将会部分失效(后面的字段索引失效)。
在 tb_user 表中有一个联合索引这个联合索引涉及到三个字段顺序分别为professionagestatus。
对于最左前缀法则指的是查询时最左边的列也就是profession必须存在否则索引全部失效。而且中间不能跳过某一列否则该列后面的字段索引将失效。
思考题
当执行SQL语句: explain select * from tb_user where age 31 and status 0 and profession 软件工程 时是否满足最左前缀法则走不走上述的联合索引索引长度是完全满足最左前缀法则的索引长度54联合索引是生效的。
注意 最左前缀法则中指的最左边的列是指在查询时联合索引的最左边的字段(即是
第一个字段)必须存在与我们编写SQL时条件编写的先后顺序无关范围查询
联合索引中出现范围查询(,)范围查询右侧的列索引失效。
explain select * from tb_user where profession 软件工程 and age 30 and status 0;当范围查询使用 或 时走联合索引了但是索引的长度为38就说明范围查询右边的status字段是没有走索引的。
explain select * from tb_user where profession 软件工程 and age 30 and status 0;当范围查询使用 或 时走联合索引了但是索引的长度为42就说明所有的字段都是走索引的。
所以在业务允许的情况下尽可能的使用类似于 或 这类的范围查询而避免使用 或 。
索引失效情况
索引列运算
不要在索引列上进行运算操作 索引将失效。
A. 当根据phone字段进行等值匹配查询时, 索引生效。
explain select * from tb_user where phone 17799990015;B. 当根据phone字段进行函数运算操作之后索引失效。
explain select * from tb_user where substring(phone,10,2) 15;字符串不加引号
字符串类型字段使用时不加引号索引将失效。
如果字符串不加单引号对于查询结果没什么影响但是数据库存在隐式类型转换索引将失效。
模糊查询
如果仅仅是尾部模糊匹配索引不会失效。如果是头部模糊匹配索引失效。
or连接条件
用or分割开的条件 如果or前的条件中的列有索引而后面的列中没有索引那么涉及的索引都不会被用到。
当or连接的条件左右两侧字段都有索引时索引才会生效。
数据分布影响
如果MySQL评估使用索引比全表更慢则不使用索引。
上面这两个相同的SQL语句只是传入的字段值不同最终的执行计划也完全不一样这是为什么呢
就是因为MySQL在查询时**会评估使用索引的效率与走全表扫描的效率**如果走全表扫描更快则放弃索引走全表扫描。 因为索引是用来索引少量数据的如果通过索引查询返回大批量的数据则还不如走全表扫描来的快此时索引就会失效。
SQL提示
我们能不能在查询的时候自己来指定使用哪个索引呢
答案是肯定的此时就可以借助于MySQL的SQL提示来完成。
下面介绍一下SQL提示
SQL提示是优化数据库的一个重要手段简单来说就是在SQL语句中加入一些人为的提示来达到优化操作的目的。
1). use index 建议MySQL使用哪一个索引完成此次查询仅仅是建议mysql内部还会再次进行评估。
explain select * from tb_user use index(idx_user_pro) where profession 软件工程;2). ignore index 忽略指定的索引。
explain select * from tb_user ignore index(idx_user_pro) where profession 软件工程;3). force index 强制使用索引。
explain select * from tb_user force index(idx_user_pro) where profession 软件工程;覆盖索引
尽量使用覆盖索引减少select *。 那么什么是覆盖索引呢
覆盖索引是指 查询使用了索引并且需要返回的列在该索引中已经全部能够找到 。
思考
思考题
一张表, 有四个字段(id, username, password, status), 由于数据量大, 需要对以下SQL语句进行优化, 该如何进行才是最优方案:
select id,username,password from tb_user where username itcast;答案: 针对于 username, password建立联合索引, sql为: create index idx_user_name_pass on tb_user(username,password);
这样可以避免上述的SQL语句在查询的过程中出现回表查询。前缀索引
当字段类型为字符串varchartextlongtext等时有时候需要索引很长的字符串这会让索引变得很大查询时浪费大量的磁盘IO 影响查询效率。此时可以只将字符串的一部分前缀建立索引这样可以大大节约索引空间从而提高索引效率。
1). 语法
create index idx_xxxx on table_name(column(n)) ;示例:
为tb_user表的email字段建立长度为5的前缀索引。 create index idx_email_5 on tb_user(email(5));2). 前缀长度
可以根据索引的选择性来决定而选择性是指不重复的索引值基数和数据表的记录总数的比值
索引选择性越高则查询效率越高 唯一索引的选择性是1这是最好的索引选择性性能也是最好的。
单列索引和联合索引
在and连接的两个字段 phone、name上都是有单列索引的但是最终mysql只会选择一个索引也就是说只能走一个字段的索引此时是会回表查询的。紧接着我们再来创建一个phone和name字段的联合索引来查询一下执行计划。
此时查询时就走了联合索引而在联合索引中包含 phone、name的信息在叶子节点下挂的是对应的主键id所以查询是无需回表查询的。
在业务场景中如果存在多个查询条件考虑针对于查询字段建立索引时建议建立联合索引而非单列索引。索引设计原则
1). 针对于数据量较大且查询比较频繁的表建立索引。
2). 针对于常作为查询条件where、排序order by、分组group by操作的字段建立索引。
3). 尽量选择区分度高的列作为索引尽量建立唯一索引区分度越高使用索引的效率越高。
4). 如果是字符串类型的字段字段的长度较长可以针对于字段的特点建立前缀索引。
5). 尽量使用联合索引减少单列索引查询时联合索引很多时候可以覆盖索引节省存储空间避免回表提高查询效率。
6). 要控制索引的数量索引并不是多多益善索引越多维护索引结构的代价也就越大会影响增删改的效率。
7). 如果索引列不能存储NULL值请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时它可以更好地确定哪个索引最有效地用于查询。
SQL优化
插入数据
insert
如果我们需要一次性往数据库表中插入多条记录可以从以下三个方面进行优化。
insert into tb_test values(1,tom);
insert into tb_test values(2,cat);
insert into tb_test values(3,jerry);
.....1). 优化方案一
批量插入数据
Insert into tb_test values(1,Tom),(2,Cat),(3,Jerry);2). 优化方案二
手动控制事务
start transaction;
insert into tb_test values(1,Tom),(2,Cat),(3,Jerry);
insert into tb_test values(4,Tom),(5,Cat),(6,Jerry);
insert into tb_test values(7,Tom),(8,Cat),(9,Jerry);
commit;3). 优化方案三
主键顺序插入性能要高于乱序插入。
主键乱序插入 : 8 1 9 21 88 2 4 15 89 5 7 3
主键顺序插入 : 1 2 3 4 5 7 8 9 15 21 88 89大批量插入数据
如果一次性需要插入大批量数据(比如: 几百万的记录)使用insert语句插入性能较低此时可以使用MySQL数据库提供的load指令进行插入。操作如下
-- 客户端连接服务端时加上参数 -–local-infile
mysql –-local-infile -u root -p-- 设置全局参数local_infile为1开启从本地加载文件导入数据的开关
set global local_infile 1;-- 执行load指令将准备好的数据加载到表结构中
load data local infile /root/sql1.log into table tb_user fields
terminated by , lines terminated by \n ;在load时主键顺序插入性能高于乱序插入主键优化
索引设计原则
满足业务需求的情况下尽量降低主键的长度。插入数据时尽量选择顺序插入选择使用AUTO_INCREMENT自增主键尽量不要使用UUID做主键或者是其他自然主键如身份证号。业务操作时避免对主键的修改。
order by 优化
MySQL的排序有两种方式
Using filesort : 通过表的索引或全表扫描读取满足条件的数据行然后在排序缓冲区sort buffer中完成排序操作所有不是通过索引直接返回排序结果的排序都叫 FileSort 排序。
Using index : 通过有序索引顺序扫描直接返回有序数据这种情况即为 using index不需要额外排序操作效率高。
对于以上的两种排序方式Using index的性能高而Using filesort的性能低我们在优化排序操作时尽量要优化为 Using index。
order by优化原则:
A. 根据排序字段建立合适的索引多字段排序时也遵循最左前缀法则。
B. 尽量使用覆盖索引。
C. 多字段排序, 一个升序一个降序此时需要注意联合索引在创建时的规则ASC/DESC。
D. 如果不可避免的出现filesort大数据量排序时可以适当增大排序缓冲区大小sort_buffer_size(默认256k)。
group by 优化
所以在分组操作中我们需要通过以下两点进行优化以提升性能
A. 在分组操作时可以通过索引来提高效率。
B. 分组操作时索引的使用也是满足最左前缀法则的。
limit优化
在数据量比较大时如果进行limit分页查询在查询时越往后分页查询效率越低。
越往后分页查询效率越低这就是分页查询的问题所在。
因为当在进行分页查询时如果执行 limit 2000000,10 此时需要MySQL排序前2000010 记录仅仅返回 2000000 - 2000010 的记录其他记录丢弃查询排序的代价非常大 。
优化思路: 一般分页查询时通过创建 覆盖索引 能够比较好地提高性能可以通过覆盖索引加子查询形式进行优化。
explain select * from tb_sku t , (select id from tb_sku order by id limit 2000000,10) a where t.id a.id;count优化
select count(*) from tb_user ;MyISAM 引擎把一个表的总行数存在了磁盘上因此执行 count() 的时候会直接返回这个数效率很高 但是如果是带条件的countMyISAM也慢。InnoDB 引擎就麻烦了它执行 count() 的时候需要把数据一行一行地从引擎里面读出来然后累积计数。
如果说要大幅度提升InnoDB表的count效率主要的优化思路自己计数(可以借助于redis这样的数据库进行,但是如果是带条件的count又比较麻烦了)。
count用法
count() 是一个聚合函数对于返回的结果集一行行地判断如果 count 函数的参数不是NULL累计值就加 1否则不加最后返回累计值。
用法count*、count主键、count字段、count数字
按照效率排序的话count(字段) count(主键 id) count(1) ≈ count(*)所以尽量使用 count(*)。update优化
下面这两个情况中id是有索引的name是没有索引的。
我们主要需要注意一下update语句执行时的注意事项。
update course set name javaEE where id 1 ;当我们在执行删除的SQL语句时会锁定id为1这一行的数据然后事务提交之后行锁释放。
但是当我们在执行如下SQL时。
update course set name SpringBoot where name PHP ;当我们开启多个事务在执行上述的SQL时我们发现行锁升级为了表锁。 导致该update语句的性能大大降低。
InnoDB的行锁是针对索引加的锁不是针对记录加的锁 ,并且该索引不能失效否则会从行锁升级为表锁 。视图
视图View是一种虚拟存在的表。视图中的数据并不在数据库中实际存在行和列数据来自定义视图的查询中使用的表并且是在使用视图时动态生成的。
通俗的讲视图只保存了查询的SQL逻辑不保存查询结果。所以我们在创建视图的时候主要的工作就落在创建这条SQL查询语句上。
语法
创建视图
CREATE [OR REPLACE] VIEW 视图名称[(列名列表)] AS SELECT语句 [ WITH [ CASCADED | LOCAL ] CHECK OPTION ]OR REPLACE可选 如果指定 OR REPLACE则表示如果视图已存在会先删除旧视图然后创建一个新的视图。 如果不指定 OR REPLACE而视图已存在SQL 会报错。
WITH [CASCADED | LOCAL] CHECK OPTION可选
WITH CHECK OPTION 是一个约束用于限制对视图的更新操作确保通过视图更新的数据仍然满足视图的定义。CASCADED默认值 表示在更新视图时不仅当前视图的定义需要满足其依赖的底层视图如果有的定义也需要满足。如果视图是基于其他视图创建的更新操作会递归检查所有相关视图的定义。 LOCAL 表示仅检查当前视图的定义而不考虑底层视图的定义。更新操作不会递归检查依赖的视图。
创建视图实例 create or replace view user_v_1 as select id,name from tb_user where id10;查询
查看创建视图语句SHOW CREATE VIEW 视图名称;
查看视图数据SELECT * FROM 视图名称 ...... ;修改
方式一CREATE [OR REPLACE] VIEW 视图名称[(列名列表)] AS SELECT语句 [ WITH [ CASCADED | LOCAL ] CHECK OPTION ]
方式二ALTER VIEW 视图名称[(列名列表)] AS SELECT语句 [ WITH [ CASCADED | LOCAL ] CHECK OPTION ]删除
DROP VIEW [IF EXISTS] 视图名称 [,视图名称] ...如果我们定义视图时如果指定了条件然后我们在插入、修改、删除数据时是否可以做到必须满足条件才能操作否则不能够操作呢 答案是可以的这就需要借助于视图的检查选项了。
检查选项
当使用WITH CHECK OPTION子句创建视图时MySQL会通过视图检查正在更改的每个行例如 插入更新删除以使其符合视图的定义。 MySQL允许基于另一个视图创建视图它还会检查依赖视图中的规则以保持一致性。为了确定检查的范围mysql提供了两个选项 CASCADED 和 LOCAL默认值为 CASCADED 。
1). CASCADED
级联
比如v2视图是基于v1视图的如果在v2视图创建的时候指定了检查选项为 cascaded但是v1视图创建时未指定检查选项。 则在执行检查时不仅会检查v2还会级联检查v2的关联视图v1。
2). LOCAL
本地
比如v2视图是基于v1视图的如果在v2视图创建的时候指定了检查选项为 local 但是v1视图创建时未指定检查选项。 则在执行检查时知会检查v2不会检查v2的关联视图v1。
视图的更新
要使视图可更新视图中的行与基础表中的行之间必须存在一对一的关系。如果视图包含以下任何一项则该视图不可更新
A. 聚合函数或窗口函数SUM()、 MIN()、 MAX()、 COUNT()等
B. DISTINCT
C. GROUP BY
D. HAVING
E. UNION 或者 UNION ALL
视图的作用
1). 简单
视图不仅可以简化用户对数据的理解也可以简化他们的操作。那些被经常使用的查询可以被定义为视图从而使得用户不必为以后的操作每次指定全部的条件。
2). 安全
数据库可以授权但不能授权到数据库特定行和特定的列上。通过视图用户只能查询和修改他们所能见到的数据
3). 数据独立
视图可帮助用户屏蔽真实表结构变化带来的影响。
案例
1). 为了保证数据库表的安全性开发人员在操作tb_user表时只能看到的用户的基本字段屏蔽手机号和邮箱两个字段。 create or replace view tb_user_view as select id,name,profession,age,gender,status,createtime from tb_user;2). 查询每个学生所选修的课程三张表联查这个功能在很多的业务中都有使用到为了简化操作定义一个视图。
create view tb_stu_course_view as select s.name student_name , s.no student_no ,c.name course_name from student s, student_course sc , course c where s.id sc.studentid and sc.courseid c.id;存储过程
存储过程是事先经过编译并存储在数据库中的一段 SQL 语句的集合调用存储过程可以简化应用开发人员的很多工作减少数据在数据库和应用服务器之间的传输对于提高数据处理的效率是有好处的。存储过程思想上很简单就是数据库 SQL 语言层面的代码封装与重用。
特点:
封装复用 ----------------------- 可以把某一业务SQL封装在存储过程中需要用到的时候直接调用即可。可以接收参数也可以返回数据 -------- 再存储过程中可以传递参数也可以接收返回值。减少网络交互效率提升 ------------- 如果涉及到多条SQL每执行一次都是一次网络传输。 而如果封装在存储过程中我们只需要网络交互一次可能就可以了。
语法
1). 创建
CREATE PROCEDURE 存储过程名称 ([ 参数列表 ])
BEGIN
-- SQL语句
END ;实例
在命令行中创建存储过程需要先修改命令结束符
# 更改命令结束符delimiter $$create procedure p1()
beginselect count(*) from tb_user;
end$$可以在执行完之后再把命令结束符改回来
2). 调用
CALL 名称 ([ 参数 ]);3). 查看
SELECT * FROM INFORMATION_SCHEMA.ROUTINES WHERE ROUTINE_SCHEMA xxx; -- 查询指定数据库的存储过程及状态信息
SHOW CREATE PROCEDURE 存储过程名称 ; -- 查询某个存储过程的定义4). 删除
DROP PROCEDURE [ IF EXISTS ] 存储过程名称 注意:
在命令行中执行创建存储过程的SQL时需要通过关键字 delimiter 指定SQL语句的结束符。变量
在MySQL中变量分为三种类型: 系统变量、用户定义变量、局部变量。
系统变量
系统变量 是MySQL服务器提供不是用户定义的属于服务器层面。分为全局变量GLOBAL、会话变量SESSION。
1). 查看系统变量
SHOW [ SESSION | GLOBAL ] VARIABLES ; -- 查看所有系统变量
SHOW [ SESSION | GLOBAL ] VARIABLES LIKE ......; -- 可以通过LIKE模糊匹配方式查找变量
SELECT [SESSION | GLOBAL].系统变量名; -- 查看指定变量的值2). 设置系统变量
SET [ SESSION | GLOBAL ] 系统变量名 值 ;
SET [SESSION | GLOBAL]系统变量名 值 ;注意:
如果没有指定SESSION/GLOBAL默认是SESSION会话变量。
-- mysql服务重新启动之后所设置的全局参数会失效要想不失效可以在 /etc/my.cnf 中配置。
A. 全局变量(GLOBAL): 全局变量针对于所有的会话。
B. 会话变量(SESSION): 会话变量针对于单个会话在另外一个会话窗口就不生效了。用户定义变量
用户定义变量 是用户根据需要自己定义的变量用户变量不用提前声明在用的时候直接用 “变量名” 使用就可以。其作用域为当前连接。
1). 赋值
方式一:
SET var_name expr [, var_name expr] ... ;
SET var_name : expr [, var_name : expr] ... ;赋值时可以使用 也可以使用 : 。
方式二:
SELECT var_name : expr [, var_name : expr] ... ;
SELECT 字段名 INTO var_name FROM 表名;2). 使用
SELECT var_name ;注意: 用户定义的变量无需对其进行声明或初始化只不过获取到的值为NULL。局部变量
局部变量 是根据需要定义的在局部生效的变量访问之前需要DECLARE声明。可用作存储过程内的局部变量和输入参数局部变量的范围是在其内声明的BEGIN … END块。
1). 声明
DECLARE 变量名 变量类型 [DEFAULT ... ] ;变量类型就是数据库字段类型INT、BIGINT、CHAR、VARCHAR、DATE、TIME等。
2). 赋值
SET 变量名 值 ;
SET 变量名 : 值 ;
SELECT 字段名 INTO 变量名 FROM 表名 ... ;-- 声明局部变量 - declare
-- 赋值
create procedure p2()
begindeclare stu_count int default 0;select count(*) into stu_count from student;select stu_count;
end;
call p2();if
1). 介绍
if 用于做条件判断具体的语法结构为
IF 条件1 THEN.....
ELSEIF 条件2 THEN -- 可选.....
ELSE -- 可选.....
END IF;在if条件判断的结构中ELSE IF 结构可以有多个也可以没有。 ELSE结构可以有也可以没有。
实例
create procedure p3()
begindeclare score int default 58;declare result varchar(10);if score 85 thenset result : 优秀;elseif score 60 thenset result : 及格;elseset result : 不及格;end if;select result;
end;
call p3();那么我们能不能把score分数动态的传递进来计算出来的分数等级是否可以作为返回值返回呢
答案是肯定的我们可以通过接下来所讲解的 参数 来解决上述的问题。
参数
1). 介绍
参数的类型主要分为以下三种IN、OUT、INOUT。 具体的含义如下
用法
CREATE PROCEDURE 存储过程名称 ([ IN/OUT/INOUT 参数名 参数类型 ])
BEGIN-- SQL语句
END ;案例1
根据传入参数score判定当前分数对应的分数等级并返回。
score 85分等级为优秀。
score 60分 且 score 85分等级为及格。
score 60分等级为不及格。
create procedure p4(in score int, out result varchar(10))
beginif score 85 thenset result : 优秀;elseif score 60 thenset result : 及格;elseset result : 不及格;end if;
end;
-- 定义用户变量 result来接收返回的数据, 用户变量可以不用声明
call p4(18, result);
select result;案例2
将传入的200分制的分数进行换算换算成百分制然后返回。
create procedure p5(inout score double)
beginset score : score * 0.5;
end;
set score 198;
call p5(score);
select score;case
1). 介绍
case结构及作用和我们在基础篇中所讲解的流程控制函数很类似。有两种语法格式
语法1
-- 含义 当case_value的值为 when_value1时执行statement_list1当值为 when_value2时执行statement_list2 否则就执行 statement_list
CASE case_valueWHEN when_value1 THEN statement_list1[ WHEN when_value2 THEN statement_list2] ...[ ELSE statement_list ]
END CASE;语法2
-- 含义 当条件search_condition1成立时执行statement_list1当条件search_condition2成立时执行statement_list2 否则就执行 statement_list
CASEWHEN search_condition1 THEN statement_list1[WHEN search_condition2 THEN statement_list2] ...[ELSE statement_list]
END CASE;案例
根据传入的月份判定月份所属的季节要求采用case结构。
1-3月份为第一季度
4-6月份为第二季度
7-9月份为第三季度
10-12月份为第四季度
create procedure p6(in month int)
begin
declare result varchar(10);
casewhen month 1 and month 3 thenset result : 第一季度;when month 4 and month 6 thenset result : 第二季度;when month 7 and month 9 thenset result : 第三季度;when month 10 and month 12 thenset result : 第四季度;elseset result : 非法参数;
end case ;
select concat(您输入的月份为: ,month, , 所属的季度为: ,result);
end;
call p6(16);注意如果判定条件有多个多个条件之间可以使用 and 或 or 进行连接while
1). 介绍
while 循环是有条件的循环控制语句。满足条件后再执行循环体中的SQL语句。具体语法为
-- 先判定条件如果条件为true则执行逻辑否则不执行逻辑
WHILE 条件 DOSQL逻辑...
END WHILE;2). 案例
计算从1累加到n的值n为传入的参数值。
-- A. 定义局部变量, 记录累加之后的值;
-- B. 每循环一次, 就会对n进行减1 , 如果n减到0, 则退出循环
create procedure p7(in n int)
begindeclare total int default 0;while n0 doset total : total n;set n : n - 1;end while;select total;
end;
call p7(100);repeat
1). 介绍
repeat是有条件的循环控制语句, 当满足until声明的条件的时候则退出循环 。具体语法为
-- 先执行一次逻辑然后判定UNTIL条件是否满足如果满足则退出。如果不满足则继续下一次循环
REPEATSQL逻辑...UNTIL 条件
END REPEAT;2). 案例
计算从1累加到n的值n为传入的参数值。(使用repeat实现)
-- A. 定义局部变量, 记录累加之后的值;
-- B. 每循环一次, 就会对n进行-1 , 如果n减到0, 则退出循环
create procedure p8(in n int)
begin
declare total int default 0;
repeatset total : total n;set n : n - 1;until n 0
end repeat;
select total;
end;
call p8(10);
call p8(100);loop
1). 介绍
LOOP 实现简单的循环如果不在SQL逻辑中增加退出循环的条件可以用其来实现简单的死循环。
LOOP可以配合一下两个语句使用
LEAVE 配合循环使用退出循环。ITERATE必须用在循环中作用是跳过当前循环剩下的语句直接进入下一次循环。
[begin_label:] LOOPSQL逻辑...
END LOOP [end_label];LEAVE label; -- 退出指定标记的循环体
ITERATE label; -- 直接进入下一次循环上述语法中出现的 begin_labelend_labellabel 指的都是我们所自定义的标记。
2). 案例一
计算从1累加到n的值n为传入的参数值。
-- A. 定义局部变量, 记录累加之后的值;
-- B. 每循环一次, 就会对n进行-1 , 如果n减到0, 则退出循环 ---- leave xx
create procedure p9(in n int)
begindeclare total int default 0;sum:loopif n0 thenleave sum;end if;set total : total n;set n : n - 1;end loop sum;select total;
end;
call p9(100);3). 案例二
计算从1到n之间的偶数累加的值n为传入的参数值。
-- A. 定义局部变量, 记录累加之后的值;
-- B. 每循环一次, 就会对n进行-1 , 如果n减到0, 则退出循环 ---- leave xx
-- C. 如果当次累加的数据是奇数, 则直接进入下一次循环. -------- iterate xx
create procedure p10(in n int)
begindeclare total int default 0;sum:loopif n0 thenleave sum;end if;if n%2 1 thenset n : n - 1;iterate sum;end if;set total : total n;set n : n - 1;end loop sum;select total;
end;
call p10(100);游标
1). 介绍
游标CURSOR是用来存储查询结果集的数据类型 , 在存储过程和函数中可以使用游标对结果集进行循环的处理。游标的使用包括游标的声明、OPEN、FETCH 和 CLOSE其语法分别如下。(使用游标之前必须先打开游标)
A. 声明游标
DECLARE 游标名称 CURSOR FOR 查询语句 ;B. 打开游标
OPEN 游标名称 ;C. 获取游标记录
FETCH 游标名称 INTO 变量 [, 变量 ] ;D. 关闭游标
CLOSE 游标名称 ;2). 案例
根据传入的参数uage来查询用户表tb_user中所有的用户年龄小于等于uage的用户姓名name和专业profession并将用户的姓名和专业插入到所创建的一张新表(id,name,profession)中。
-- 逻辑:
-- A. 声明游标, 存储查询结果集
-- B. 准备: 创建表结构
-- C. 开启游标
-- D. 获取游标中的记录
-- E. 插入数据到新表中
-- F. 关闭游标create procedure p11(in uage int)
begin-- 注意游标的声明应该在变量之后declare uname varchar(100);declare upro varchar(100);declare u_cursor cursor for select name,profession from tb_user where age
uage;drop table if exists tb_user_pro;create table if not exists tb_user_pro(id int primary key auto_increment,name varchar(100),profession varchar(100));open u_cursor;while true dofetch u_cursor into uname,upro;insert into tb_user_pro values (null, uname, upro);end while;close u_cursor;
end;
call p11(30);上述的存储过程最终我们在调用的过程中会报错之所以报错是因为上面的while循环中并没有退出条件。当游标的数据集获取完毕之后再次获取数据就会报错从而终止了程序的执行。
但是此时tb_user_pro表结构及其数据都已经插入成功了我们可以直接刷新表结构检查表结构中的数据。
上述的功能虽然我们实现了但是逻辑并不完善而且程序执行完毕获取不到数据数据库还报错。 接下来我们就需要来完成这个存储过程并且解决这个问题。要想解决这个问题就需要通过MySQL中提供的 条件处理程序 Handler 来解决。
条件处理程序
1). 介绍
条件处理程序Handler可以用来定义在流程控制结构执行过程中遇到问题时相应的处理步骤。具体
语法为
DECLARE handler_action HANDLER FOR condition_value [, condition_value] ... statement ;handler_action 的取值CONTINUE: 继续执行当前程序EXIT: 终止执行当前程序condition_value 的取值SQLSTATE sqlstate_value: 状态码如 02000SQLWARNING: 所有以01开头的SQLSTATE代码的简写NOT FOUND: 所有以02开头的SQLSTATE代码的简写SQLEXCEPTION: 所有没有被SQLWARNING 或 NOT FOUND捕获的SQLSTATE代码的简写2). 案例
我们继续来完成在上一小节提出的这个需求并解决其中的问题。
根据传入的参数uage来查询用户表tb_user中所有的用户年龄小于等于uage的用户姓名
name和专业profession并将用户的姓名和专业插入到所创建的一张新表(id,name,profession)中。
A. 通过SQLSTATE指定具体的状态码
-- 逻辑:
-- A. 声明游标, 存储查询结果集
-- B. 准备: 创建表结构
-- C. 开启游标
-- D. 获取游标中的记录
-- E. 插入数据到新表中
-- F. 关闭游标
create procedure p11(in uage int)
begindeclare uname varchar(100);declare upro varchar(100);declare u_cursor cursor for select name,profession from tb_user where age uage;-- 声明条件处理程序 当SQL语句执行抛出的状态码为02000时将关闭游标u_cursor并退出declare exit handler for SQLSTATE 02000 close u_cursor;drop table if exists tb_user_pro;create table if not exists tb_user_pro(id int primary key auto_increment,name varchar(100),profession varchar(100));open u_cursor;while true dofetch u_cursor into uname,upro;insert into tb_user_pro values (null, uname, upro);end while;close u_cursor;
end;
call p11(30);B. 通过SQLSTATE的代码简写方式 NOT FOUND
02 开头的状态码代码简写为 NOT FOUND
create procedure p12(in uage int)
begindeclare uname varchar(100);declare upro varchar(100);declare u_cursor cursor for select name,profession from tb_user where age
uage;-- 声明条件处理程序 当SQL语句执行抛出的状态码为02开头时将关闭游标u_cursor并退出declare exit handler for not found close u_cursor;drop table if exists tb_user_pro;create table if not exists tb_user_pro(id int primary key auto_increment,name varchar(100),profession varchar(100));open u_cursor;while true dofetch u_cursor into uname,upro;insert into tb_user_pro values (null, uname, upro);end while;close u_cursor;
end;
call p12(30);具体的错误状态码可以参考官方文档
https://dev.mysql.com/doc/refman/8.0/en/declare-handler.html
https://dev.mysql.com/doc/mysql-errors/8.0/en/server-error-reference.html
存储函数
1). 介绍
存储函数是有返回值的存储过程存储函数的参数只能是IN类型的。具体语法如下
CREATE FUNCTION 存储函数名称 ([ 参数列表 ])
RETURNS type [characteristic ...]
BEGIN-- SQL语句RETURN ...;
END ;characteristic说明
DETERMINISTIC相同的输入参数总是产生相同的结果NO SQL 不包含 SQL 语句。READS SQL DATA包含读取数据的语句但不包含写入数据的语句。
2). 案例
计算从1累加到n的值n为传入的参数值。
create function fun1(n int)
returns int deterministic
begindeclare total int default 0;while n0 doset total : total n;set n : n - 1;end while;return total;end;
select fun1(50);在mysql8.0版本中binlog默认是开启的一旦开启了mysql就要求在定义存储过程时需要指定characteristic特性否则就会报错误
触发器
触发器是与表有关的数据库对象指在insert/update/delete之前(BEFORE)或之后(AFTER)触发并执行触发器中定义的SQL语句集合。触发器的这种特性可以协助应用在数据库端确保数据的完整性, 日志记录 , 数据校验等操作 。
使用别名OLD和NEW来引用触发器中发生变化的记录内容这与其他的数据库是相似的。现在触发器还只支持行级触发不支持语句级触发。
语法
1). 创建
CREATE TRIGGER trigger_name
BEFORE/AFTER INSERT/UPDATE/DELETE
ON tbl_name FOR EACH ROW -- 行级触发器
BEGINtrigger_stmt ;
END;2). 查看
SHOW TRIGGERS ;3). 删除
DROP TRIGGER [schema_name.]trigger_name ; -- 如果没有指定 schema_name默认为当前数据库 。案例
通过触发器记录 tb_user 表的数据变更日志将变更日志插入到日志表user_logs中, 包含增加,修改 , 删除 ;
表结构准备
-- 准备工作 : 日志表 user_logs
create table user_logs(
id int(11) not null auto_increment,
operation varchar(20) not null comment 操作类型, insert/update/delete,
operate_time datetime not null comment 操作时间,
operate_id int(11) not null comment 操作的ID,
operate_params varchar(500) comment 操作参数,
primary key(id)
)engineinnodb default charsetutf8;A. 插入数据触发器
create trigger tb_user_insert_triggerafter insert on tb_user for each row
begin
insert into user_logs(id, operation, operate_time, operate_id, operate_params)
VALUES(null, insert, now(), new.id, concat(插入的数据内容为:id,new.id,,name,new.name, , phone, NEW.phone, , email, NEW.email, ,profession, NEW.profession));
end;测试:
-- 查看
show triggers ;-- 插入数据到tb_user
insert into tb_user(id, name, phone, email, profession, age, gender, status,
createtime) VALUES (26,三皇子,18809091212,erhuangzi163.com,软件工
程,23,1,1,now());B. 修改数据触发器
create trigger tb_user_update_trigger
after update on tb_user for each row
begin
insert into user_logs(id, operation, operate_time, operate_id, operate_params)
VALUES
(null, update, now(), new.id,concat(更新之前的数据: id,old.id,,name,old.name, , phone,old.phone, , email, old.email, , profession, old.profession, | 更新之后的数据: id,new.id,,name,new.name, , phone,
NEW.phone, , email, NEW.email, , profession, NEW.profession));
end;测试
-- 查看
show triggers ;
-- 更新
update tb_user set profession 会计 where id 23;
update tb_user set profession 会计 where id 5;C. 删除数据触发器
create trigger tb_user_delete_trigger
after delete on tb_user for each row
begin
insert into user_logs(id, operation, operate_time, operate_id, operate_params)
VALUES
(null, delete, now(), old.id,
concat(删除之前的数据: id,old.id,,name,old.name, , phone,
old.phone, , email, old.email, , profession, old.profession));
end;测试:
-- 查看
show triggers ;
-- 删除数据
delete from tb_user where id 26;锁
锁是计算机协调多个进程或线程并发访问某一资源的机制。在数据库中除传统的计算资源CPU、
RAM、I/O的争用以外数据也是一种供许多用户共享的资源。如何保证数据并发访问的一致性、有
效性是所有数据库必须解决的一个问题锁冲突也是影响数据库并发访问性能的一个重要因素。从这个
角度来说锁对数据库而言显得尤其重要也更加复杂。
MySQL中的锁按照锁的粒度分分为以下三类
全局锁锁定数据库中的所有表。表级锁每次操作锁住整张表。行级锁每次操作锁住对应的行数据。
全局锁
全局锁就是对整个数据库实例加锁加锁后整个实例就处于只读状态后续的DML的写语句DDL语句已经更新操作的事务提交语句都将被阻塞。
其典型的使用场景是做全库的逻辑备份对所有的表进行锁定从而获取一致性视图保证数据的完整性。
为什么全库逻辑备份就需要加全就锁呢
A. 我们一起先来分析一下不加全局锁可能存在的问题。
假设在数据库中存在这样三张表: tb_stock 库存表tb_order 订单表tb_orderlog 订单日志表。
在进行数据备份时先备份了tb_stock库存表。
然后接下来在业务系统中执行了下单操作扣减库存生成订单更新tb_stock表插入tb_order表。然后再执行备份 tb_order表的逻辑。业务中执行插入订单日志操作。最后又备份了tb_orderlog表。
此时备份出来的数据是存在问题的。因为备份出来的数据tb_stock表与tb_order表的数据不一致(有最新操作的订单信息,但是库存数没减)。
那如何来规避这种问题呢? 此时就可以借助于MySQL的全局锁来解决。
B. 再来分析一下加了全局锁后的情况
对数据库进行进行逻辑备份之前先对整个数据库加上全局锁一旦加了全局锁之后其他的DDL、DML全部都处于阻塞状态但是可以执行DQL语句也就是处于只读状态而数据备份就是查询操作。那么数据在进行逻辑备份的过程中数据库中的数据就是不会发生变化的这样就保证了数据的一致性和完整性。
语法
1). 加全局锁
flush tables with read lock ;2). 数据备份
mysqldump -uroot –p1234 itcast itcast.sql数据备份的相关指令, 在后面MySQL管理章节, 还会详细讲解.
3). 释放锁
unlock tables ;特点
数据库中加全局锁是一个比较重的操作存在以下问题
如果在主库上备份那么在备份期间都不能执行更新业务基本上就得停摆。如果在从库上备份那么在备份期间从库不能执行主库同步过来的二进制日志binlog会导致主从延迟。
在InnoDB引擎中我们可以在备份时加上参数 --single-transaction 参数来完成不加锁的一致性数据备份。
mysqldump --single-transaction -uroot –p123456 itcast itcast.sql表级锁
表级锁每次操作锁住整张表。锁定粒度大发生锁冲突的概率最高并发度最低。应用在MyISAM、InnoDB、BDB等存储引擎中。
对于表级锁主要分为以下三类
表锁元数据锁meta data lockMDL意向锁
表锁
对于表锁分为两类
表共享读锁read lock表独占写锁write lock
语法
加锁lock tables 表名… read/write。释放锁unlock tables / 客户端断开连接 。
特点:
A. 读锁
客户端一对指定表加了读锁不会影响客户端二的读但是会阻塞客户端二的写。
B. 写锁
客户端一对指定表加了写锁会阻塞客户端二的读和写。
结论: 读锁不会阻塞其他客户端的读但是会阻塞写。写锁既会阻塞其他客户端的读又会阻塞其他客户端的写。元数据锁
meta data lock , 元数据锁简写MDL。
MDL加锁过程是系统自动控制无需显式使用在访问一张表的时候会自动加上。MDL锁主要作用是维护表元数据的数据一致性在表上有活动事务的时候不可以对元数据进行写入操作。为了避免DML与DDL冲突保证读写的正确性。
这里的元数据大家可以简单理解为就是一张表的表结构。 也就是说某一张表涉及到未提交的事务时是不能够修改这张表的表结构的。
在MySQL5.5中引入了MDL当对一张表进行增删改查的时候加MDL读锁(共享)当对表结构进行变更操作的时候加MDL写锁(排他)。
select object_type,object_schema,object_name,lock_type,lock_duration from performance_schema.metadata_locks ;可以通过上述的SQL语句来查看元数据锁的加锁情况
意向锁
1). 介绍
为了避免DML在执行时加的行锁与表锁的冲突在InnoDB中引入了意向锁使得表锁不用检查每行数据是否加锁使用意向锁来减少表锁的检查。
假如没有意向锁客户端一对表加了行锁后客户端二如何给表加表锁呢来通过示意图简单分析一下
首先客户端一开启一个事务然后执行DML操作在执行DML语句时会对涉及到的行加行锁。
当客户端二想对这张表加表锁时会检查当前表是否有对应的行锁如果没有则添加表锁此时就会从第一行数据检查到最后一行数据效率较低。
有了意向锁之后 :
客户端一在执行DML操作时会对涉及的行加行锁同时也会对该表加上意向锁。
而其他客户端在对这张表加表锁的时候会根据该表上所加的意向锁来判定是否可以成功加表锁而不用逐行判断行锁情况了。
2). 分类
意向共享锁(IS): 由语句select … lock in share mode添加 。 与 表锁共享锁(read)兼容与表锁排他锁(write)互斥。意向排他锁(IX): 由insert、update、delete、select…for update添加 。与表锁共享锁(read)及排他锁(write)都互斥意向锁之间不会互斥。
一旦事务提交了意向共享锁、意向排他锁都会自动释放可以通过以下SQL查看意向锁及行锁的加锁情况
select object_schema,object_name,index_name,lock_type,lock_mode,lock_data from performance_schema.data_locks;行级锁
介绍
行级锁每次操作锁住对应的行数据。锁定粒度最小发生锁冲突的概率最低并发度最高。应用在InnoDB存储引擎中。
InnoDB的数据是基于索引组织的行锁是通过对索引上的索引项加锁来实现的而不是对记录加的锁。对于行级锁主要分为以下三类 行锁Record Lock锁定单个行记录的锁防止其他事务对此行进行update和delete。在RC、RR隔离级别下都支持。 间隙锁Gap Lock锁定索引记录间隙不含该记录确保索引记录间隙不变防止其他事务在这个间隙进行insert产生幻读。在RR隔离级别下都支持。 临键锁Next-Key Lock行锁和间隙锁组合同时锁住数据并锁住数据前面的间隙Gap。在RR隔离级别下支持。
行锁
1). 介绍
InnoDB实现了以下两种类型的行锁
共享锁S允许一个事务去读一行阻止其他事务获得相同数据集的排它锁。排他锁X允许获取排他锁的事务更新数据阻止其他事务获得相同数据集的共享锁和排他锁。
2). 演示
默认情况下InnoDB在 REPEATABLE READ事务隔离级别运行InnoDB使用 next-key 锁进行搜
索和索引扫描以防止幻读。
针对唯一索引进行检索时对已存在的记录进行等值匹配时将会自动优化为行锁。InnoDB的行锁是针对于索引加的锁不通过索引条件检索数据那么InnoDB将对表中的所有记录加锁此时 就会升级为表锁。
可以通过以下SQL查看意向锁及行锁的加锁情况
select object_schema,object_name,index_name,lock_type,lock_mode,lock_data from performance_schema.data_locks;
-- performance_schema.data_locks 表是在 MySQL 8.0 中引入的。如果你使用的是 MySQL 5.7 或更早版本那么该表将不存在。
A. 普通的select语句执行时不会加锁。
B. select…lock in share mode加共享锁共享锁与共享锁之间兼容。
共享锁与排他锁之间互斥。
客户端一获取的是id为1这行的共享锁客户端二是可以获取id为3这行的排它锁的因为不是同一行数据。 而如果客户端二想获取id为1这行的排他锁会处于阻塞状态以为共享锁与排他锁之间互斥。
C. 排它锁与排他锁之间互斥
当客户端一执行update语句会为id为1的记录加排他锁 客户端二如果也执行update语句更新id为1的数据也要为id为1的数据加排他锁但是客户端二会处于阻塞状态因为排他锁之间是互斥的。 直到客户端一把事务提交了才会把这一行的行锁释放此时客户端二解除阻塞。
D. 无索引行锁升级为表锁
在客户端一中开启事务并执行update语句更新name为Lily的数据也就是id为19的记录 。然后在客户端二中更新id为3的记录却不能直接执行会处于阻塞状态为什么呢
原因就是因为此时客户端一根据name字段进行更新时name字段是没有索引的如果没有索引此时行锁会升级为表锁(因为行锁是对索引项加的锁而name没有索引)。
间隙锁临键锁
默认情况下InnoDB在 REPEATABLE READ事务隔离级别运行InnoDB使用 next-key 锁进行搜索和索引扫描以防止幻读。
索引上的等值查询(唯一索引)给不存在的记录加锁时, 优化为间隙锁 。索引上的等值查询(非唯一普通索引)向右遍历时最后一个值不满足查询需求时next-key lock 退化为间隙锁。索引上的范围查询(唯一索引)–会访问到不满足条件的第一个值为止。
注意间隙锁唯一目的是防止其他事务插入间隙。间隙锁可以共存一个事务采用的间隙锁不会阻止另一个事务在同一间隙上采用间隙锁。A. 索引上的等值查询(唯一索引)给不存在的记录加锁时, 优化为间隙锁 。
B. 索引上的等值查询(非唯一普通索引)向右遍历时最后一个值不满足查询需求时next-key lock 退化为间隙锁。
介绍分析一下
我们知道InnoDB的B树索引叶子节点是有序的双向链表。 假如我们要根据这个二级索引查询值为18的数据并加上共享锁我们是只锁定18这一行就可以了吗 并不是因为是非唯一索引这个结构中可能有多个18的存在所以在加锁时会继续往后找找到一个不满足条件的值当前案例中也就是29。此时会对18加临键锁并对29之前的间隙加锁。
C. 索引上的范围查询(唯一索引)–会访问到不满足条件的第一个值为止。
查询的条件为id19并添加共享锁。 此时我们可以根据数据库表中现有的数据将数据分为三个部分
[19]
(19,25]
(25,∞]
所以数据库数据在加锁是就是将19加了行锁25的临键锁包含25及25之前的间隙正无穷的临键锁(正无穷及之前的间隙)。
InnoDB引擎
逻辑存储结构
1). 表空间
表空间是InnoDB存储引擎逻辑结构的最高层 如果用户启用了参数 innodb_file_per_table(在8.0版本中默认开启) 则每张表都会有一个表空间xxx.ibd一个mysql实例可以对应多个表空间用于存储记录、索引等数据。
2). 段
段分为数据段Leaf node segment、索引段Non-leaf node segment、回滚段Rollback segmentInnoDB是索引组织表数据段就是B树的叶子节点 索引段即为B树的非叶子节点。段用来管理多个Extent区。
3). 区
区表空间的单元结构每个区的大小为1M。 默认情况下 InnoDB存储引擎页大小为16K 即一个区中一共有64个连续的页。
4). 页
页是InnoDB 存储引擎磁盘管理的最小单元每个页的大小默认为 16KB。为了保证页的连续性InnoDB 存储引擎每次从磁盘申请 4-5 个区。
5). 行
行InnoDB 存储引擎数据是按行进行存放的。
在行中默认有两个隐藏字段
Trx_id每次对某条记录进行改动时都会把对应的事务id赋值给trx_id隐藏列。Roll_pointer每次对某条引记录进行改动时都会把旧的版本写入到undo日志中然后这个隐藏列就相当于一个指针可以通过它来找到该记录修改前的信息。
架构
概述
MySQL5.5 版本开始默认使用InnoDB存储引擎它擅长事务处理具有崩溃恢复特性在日常开发中使用非常广泛。下面是InnoDB架构图左侧为内存结构右侧为磁盘结构。
内存结构
在左侧的内存结构中主要分为这么四大块儿 Buffer Pool、Change Buffer、Adaptive Hash Index、Log Buffer。 接下来介绍一下这四个部分。
1). Buffer Pool
InnoDB存储引擎基于磁盘文件存储访问物理硬盘和在内存中进行访问速度相差很大为了尽可能弥补这两者之间的I/O效率的差值就需要把经常使用的数据加载到缓冲池中避免每次访问都进行磁盘I/O。
在InnoDB的缓冲池中不仅缓存了索引页和数据页还包含了undo页、插入缓存、自适应哈希索引以及InnoDB的锁信息等等。
缓冲池 Buffer Pool是主内存中的一个区域里面可以缓存磁盘上经常操作的真实数据在执行增删改查操作时先操作缓冲池中的数据若缓冲池没有数据则从磁盘加载并缓存然后再以一定频率刷新到磁盘从而减少磁盘IO加快处理速度。
缓冲池以Page页为单位底层采用链表数据结构管理Page。根据状态将Page分为三种类型 free page空闲page未被使用。 clean page被使用page数据没有被修改过。 dirty page脏页被使用page数据被修改过也中数据与磁盘的数据产生了不一致。
在专用服务器上通常将多达80的物理内存分配给缓冲池 。参数设置 show variables like ‘innodb_buffer_pool_size’;
2). Change Buffer
Change Buffer更改缓冲区针对于非唯一二级索引页在执行DML语句时如果这些数据Page没有在Buffer Pool中不会直接操作磁盘而会将数据变更存在更改缓冲区 Change Buffer中在未来数据被读取时再将数据合并恢复到Buffer Pool中再将合并后的数据刷新到磁盘中。
Change Buffer的意义是什么呢?
先来看一幅图这个是二级索引的结构图
与聚集索引不同二级索引通常是非唯一的并且以相对随机的顺序插入二级索引。同样删除和更新可能会影响索引树中不相邻的二级索引页如果每一次都操作磁盘会造成大量的磁盘IO。有了ChangeBuffer之后我们可以在缓冲池中进行合并处理减少磁盘IO。
3). Adaptive Hash Index
自适应hash索引用于优化对Buffer Pool数据的查询。MySQL的innoDB引擎中虽然没有直接支持hash索引但是给我们提供了一个功能就是这个自适应hash索引。因为前面我们讲到过hash索引在进行等值匹配时一般性能是要高于B树的因为hash索引一般只需要一次IO即可而B树可能需要几次匹配所以hash索引的效率要高但是hash索引又不适合做范围查询、模糊匹配等。
InnoDB存储引擎会监控对表上各索引页的查询如果观察到在特定的条件下hash索引可以提升速度则建立hash索引称之为自适应hash索引。
自适应哈希索引无需人工干预是系统根据情况自动完成。
参数 adaptive_hash_index
4). Log Buffer
Log Buffer日志缓冲区用来保存要写入到磁盘中的log日志数据redo log 、undo log默认大小为 16MB日志缓冲区的日志会定期刷新到磁盘中。如果需要更新、插入或删除许多行的事务增加日志缓冲区的大小可以节省磁盘 I/O。
参数:
innodb_log_buffer_size缓冲区大小
innodb_flush_log_at_trx_commit日志刷新到磁盘时机取值主要包含以下三个
1: 日志在每次事务提交时写入并刷新到磁盘默认值。
0: 每秒将日志写入并刷新到磁盘一次。
2: 日志在每次事务提交后写入并每秒刷新到磁盘一次。
磁盘结构
接下来再来看看InnoDB体系结构的右边部分也就是磁盘结构
1). System Tablespace
系统表空间是更改缓冲区的存储区域。如果表是在系统表空间而不是每个表文件或通用表空间中创建的它也可能包含表和索引数据。(在MySQL5.x版本中还包含InnoDB数据字典、undolog等)
参数innodb_data_file_path
2). File-Per-Table Tablespaces
如果开启了innodb_file_per_table开关 则每个表的文件表空间包含单个InnoDB表的数据和索引 并存储在文件系统上的单个数据文件中。
开关参数innodb_file_per_table 该参数默认开启
那也就是说我们没创建一个表都会产生一个表空间文件。
3). General Tablespaces
通用表空间需要通过 CREATE TABLESPACE 语法创建通用表空间在创建表时可以指定该表空间。
A. 创建表空间
CREATE TABLESPACE ts_name ADD DATAFILE file_name ENGINE engine_name;B. 创建表时指定表空间
CREATE TABLE xxx ... TABLESPACE ts_name;4). Undo Tablespaces
撤销表空间MySQL实例在初始化时会自动创建两个默认的undo表空间初始大小16M用于存储undo log日志。
5). Temporary Tablespaces
InnoDB 使用会话临时表空间和全局临时表空间。存储用户创建的临时表等数据。
6). Doublewrite Buffer Files
双写缓冲区innoDB引擎将数据页从Buffer Pool刷新到磁盘前先将数据页写入双写缓冲区文件中便于系统异常时恢复数据。
7). Redo Log
重做日志是用来实现事务的持久性。该日志文件由两部分组成重做日志缓冲redo logbuffer以及重做日志文件redo log,前者是在内存中后者在磁盘中。当事务提交之后会把所有修改信息都会存到该日志中, 用于在刷新脏页到磁盘时,发生错误时, 进行数据恢复使用。
以循环方式写入重做日志文件涉及两个文件
前面我们介绍了InnoDB的内存结构以及磁盘结构那么内存中我们所更新的数据又是如何到磁盘中的呢 此时就涉及到一组后台线程接下来就来介绍一些InnoDB中涉及到的后台线程。
后台线程
在InnoDB的后台线程中分为4类分别是Master Thread 、IO Thread、Purge Thread、Page Cleaner Thread。
1). Master Thread
核心后台线程负责调度其他线程还负责将缓冲池中的数据异步刷新到磁盘中, 保持数据的一致性
还包括脏页的刷新、合并插入缓存、undo页的回收 。
2). IO Thread
在InnoDB存储引擎中大量使用了AIO来处理IO请求, 这样可以极大地提高数据库的性能而IO
Thread主要负责这些IO请求的回调。
我们可以通过以下的这条指令查看到InnoDB的状态信息其中就包含IO Thread信息。
show engine innodb status \G;3). Purge Thread
主要用于回收事务已经提交了的undo log在事务提交之后undo log可能不用了就用它来回收。
4). Page Cleaner Thread
协助 Master Thread 刷新脏页到磁盘的线程它可以减轻 Master Thread 的工作压力减少阻塞。
事务原理
事务基础
1). 事务
事务一组操作的集合它是一个不可分割的工作单位事务会把所有的操作作为一个整体一起向系统提及或撤销操作请求即这些操作要么同时成功要么同时失败。
2). 特性
原子性Atomicity事务是不可分割的最小操作单元要么全部成功要么全部失败。一致性Consistency事务完成时必须使所有的数据都保持一致状态。隔离性Isolation数据库系统提供的隔离机制保证事务在不受外部并发操作影响的独立环境下运行。持久性Durability事务一旦提交或回滚它对数据库中的数据的改变就是永久的。
原子性是通过undolog日志来保证的。
持久性是通过redolog日志来保证的。
隔离性是通过锁MVCC来保证的。
而上面说的原子性一致性隔离性这三个都是依赖数据库的具体体现唯独一致性实际上依赖于应用层也就是依赖于开发者上面说的三个属性都是为了保证一致性而存在的
通过预写式日志undo log保证原子性redo log保证持久性设置隔离级别保证并发事务进行的时候保证数据一致性。
而对于这四大特性实际上分为两个部分。 其中的原子性、一致性、持久化实际上是由InnoDB中的两份日志来保证的一份是redo log日志一份是undo log日志。 而隔离性是通过数据库的锁加上MVCC来保证的。
redo log
重做日志记录的是事务提交时数据页的物理修改是用来实现事务的持久性。
该日志文件由两部分组成重做日志缓冲redo log buffer以及重做日志文件redo logfile,前者是在内存中后者在磁盘中。当事务提交之后会把所有修改信息都存到该日志文件中, 用于在刷新脏页到磁盘,发生错误时, 进行数据恢复使用。
如果没有redolog可能会存在什么问题的 我们一起来分析一下。
我们知道在InnoDB引擎中的内存结构中主要的内存区域就是缓冲池在缓冲池中缓存了很多的数据页。 当我们在一个事务中执行
多个增删改的操作时InnoDB引擎会先操作缓冲池中的数据如果缓冲区没有对应的数据会通过后台线程将磁盘中的数据加载出来
存放在缓冲区中然后将缓冲池中的数据修改修改后的数据页我们称为脏页。 而脏页则会在一定的时机通过后台线程刷新到磁盘
中从而保证缓冲区与磁盘的数据一致。 而缓冲区的脏页数据并不是实时刷新的而是一段时间之后将缓冲区的数据刷新到磁盘中假
如刷新到磁盘的过程出错了而提示给用户事务提交成功而数据却没有持久化下来这就出现问题了没有保证事务的持久性。
那么如何解决上述的问题呢 在InnoDB中提供了一份日志 redo log接下来我们再来分析一下通过redolog如何解决这个问题。
有了redolog之后当对缓冲区的数据进行增删改之后会首先将操作的数据页的变化记录在redo log buffer中。在事务提交时会将
redo log buffer中的数据刷新到redo log磁盘文件中。过一段时间之后如果刷新缓冲区的脏页到磁盘时发生错误此时就可以借助于
redo log进行数据恢复这样就保证了事务的持久性。 而如果脏页成功刷新到磁盘 或 或者涉及到的数据已经落盘此时redolog就没有作
用了就可以删除了所以存在的两个redolog文件是循环写的。
那为什么每一次提交事务要刷新redo log 到磁盘中呢而不是直接将buffer pool中的脏页刷新到磁盘呢 ?
因为在业务操作中我们操作数据一般都是随机读写磁盘的而不是顺序读写磁盘。 而redo log在往磁盘文件中写入数据由于是日志文
件写入时都是追加的所以都是顺序写的。顺序写的效率要远大于随机写。 这种先写日志的方式称之为 WALWrite-Ahead Logging先写日志后写数据。
undo log
回滚日志用于记录数据被修改前的信息 , 作用包含两个 : 提供回滚(保证事务的原子性) 和 MVCC(多版本并发控制) 。
undo log和redo log记录物理日志不一样它是逻辑日志。可以认为当delete一条记录时undo log中会记录一条对应的insert记录反之亦然当update一条记录时它记录一条对应相反的update记录。当执行rollback时就可以从undo log中的逻辑记录读取到相应的内容并进行回滚。
Undo log销毁undo log在事务执行时产生事务提交时并不会立即删除undo log因为这些日志可能还用于MVCC。
Undo log存储undo log采用段的方式进行管理和记录存放在前面介绍的 rollback segment 回滚段中内部包含1024个undo log segment。
MVCC(多版本并发控制)
Multi-Version Concurrency Control
请你讲下MVCC是什么
答全称Multi-Version Concurrency Control、就是一种多并发版本控制器、通俗点就是一种并发控制的方法一般用于数据库中对数据库
的并发访问。Mysql中的innoDB中就是使用这种方法来提高读写事务控制的、他大大提高了读写事务的并发性能原因是MVCC是一种不
采用锁来控制事物的方式是一种非堵塞、同时还可以解决脏读幻读不可重复读等事务隔离问题但不能解决更新丢失问题。
1). 当前读
读取的是记录的最新版本读取时还要保证其他并发事务不能修改当前记录会对读取的记录进行加锁(加的悲观锁)。对于我们日常的操作如select … lock in share mode(共享锁)select … for update、update、insert、delete(排他锁)都是一种当前读。
在测试中我们可以看到即使是在默认的RR隔离级别下事务A中依然可以读取到事务B最新提交的内容因为在查询语句后面加上了 lock in share mode 共享锁此时是当前读操作。当然当我们加排他锁的时候也是当前读操作。
2). 快照读
简单的select不加锁就是快照读快照读读取的是记录数据的可见版本有可能是历史数据不加锁是非阻塞读。
• Read Committed每次select都生成一个快照读。
• Repeatable Read开启事务后第一个select语句才是快照读的地方。
• Serializable快照读会退化为当前读。
在测试中,我们看到即使事务B提交了数据,事务A中也查询不到。 原因就是因为普通的select是快照读而在当前默认的RR隔离级别下开启事务后第一个select语句才是快照读的地方后面执行相同的select语句都是从快照中获取数据可能不是当前的最新数据这样也就保证了可重复读
3). MVCC
全称 Multi-Version Concurrency Control多版本并发控制。指维护一个数据的多个版本使得读写操作没有冲突快照读为MySQL实现MVCC提供了一个非阻塞读功能。MVCC的具体实现还需要依赖于数据库记录中的三个隐式字段、undo log日志、readView。
接下来我们再来介绍一下InnoDB引擎的表中涉及到的隐藏字段 、undolog 以及 readview
从而来介绍一下MVCC的原理。
隐藏字段
当我们创建了上面的这张表我们在查看表结构的时候就可以显式的看到这三个字段。 实际上除了
这三个字段以外InnoDB还会自动的给我们添加三个隐藏字段及其含义分别是
而上述的前两个字段是肯定会添加的 是否添加最后一个字段DB_ROW_ID得看当前表有没有主键如果有主键则不会添加该隐藏字段。
undolog
回滚日志在insert、update、delete的时候产生的便于数据回滚的日志。当insert的时候产生的undo log日志只在回滚时需要在事务提交后可被立即删除。而update、delete的时候产生的undo log日志不仅在回滚时需要在快照读时也需要不会立即被删除。
版本链
-- DB_TRX_ID : 代表最近修改事务ID记录插入这条记录或最后一次修改该记录的事务ID是自增的。
-- DB_ROLL_PTR 由于这条数据是才插入的没有被更新过所以该字段值为null。我们发现不同事务或相同事务对同一条记录进行修改会导致该记录的undolog生成一条
记录版本链表链表的头部是最新的旧记录链表尾部是最早的旧记录。readview
ReadView读视图是 快照读 SQL执行时MVCC提取数据的依据记录并维护系统当前活跃的事务未提交的id。
而在readview中就规定了版本链数据的访问规则
trx_id 代表当前undolog版本链对应事务ID。
不同的隔离级别生成ReadView的时机不同 READ COMMITTED 在事务中每一次执行快照读时生成ReadView。 REPEATABLE READ仅在事务中第一次执行快照读时生成ReadView后续复用该ReadView。
原理分析
RC隔离级别
RC隔离级别下在事务中每一次执行快照读时生成ReadView。
RR隔离级别
RR隔离级别下仅在事务中第一次执行快照读时生成ReadView后续复用该ReadView。 而RR 是可
重复读在一个事务中执行两次相同的select语句查询到的结果是一样的。
那MySQL是如何做到可重复读的呢? 我们简单分析一下就知道了
我们看到在RR隔离级别下只是在事务中第一次快照读时生成ReadView后续都是复用该
ReadView那么既然ReadView都一样 ReadView的版本链匹配规则也一样 那么最终快照读返回的结果也是一样的。
所以呢MVCC的实现原理就是通过 InnoDB表的隐藏字段、UndoLog 版本链、ReadView来实现的。
而MVCC 锁则实现了事务的隔离性。 而一致性则是由redolog 与 undolog保证。