商城外贸网站设计,四川省建设工程质量监理协会网站,番禺网站设计,网站建设的词目录
• InnoDB事务
– 事务结构/功能
– XA事务/Group Commit
– mini-transaction• InnoDB锁 – 锁结构/类型/功能
– 锁等待/死锁检测
– 自增序列锁(autoinc lock)
– 半一致读(semi-consistent read)
– 隐式锁(implicit lock)
• InnoDB多版本
– ReadView
–…目录
• InnoDB事务
– 事务结构/功能
– XA事务/Group Commit
– mini-transaction• InnoDB锁 – 锁结构/类型/功能
– 锁等待/死锁检测
– 自增序列锁(autoinc lock)
– 半一致读(semi-consistent read)
– 隐式锁(implicit lock)
• InnoDB多版本
– ReadView
– 聚簇索引/二级索引
– 快照读 – Index Only Scan
– RC vs RR
– Purge
• InnoDB事务/锁/多版本总结 InnoDB事务
– 事务结构/功能
– XA事务/Group Commit
– mini-transaction InnoDB事务-结构 InnoDB事务-结构(cont.)
• trx_sys(全局唯一)
– mutex critical section控制事务的分配/提交/回滚
– max_trx_id 当前系统最大的事务号 分配256次写一次文件持久化
– trx_list 系统当前所有活跃事务链表
– view_list 系统当前所有ReadView链表 • trx_struct(事务对象)
– id/no 事务号标识事务起始/提交顺序 • id用户可见no用户不可见共用trx_sys的max_trx_id进行分配 – xid XA事务标识 – (global)read_view: 事务所属的ReadView
– trx_locks 事务持有的所有lock(表锁/记录锁/Autoinc锁)
– wait_lock 事务当前正在等待的lock
InnoDB事务-功能 快照读
– 创建ReadView实现RC/RR隔离级别(MVCC时分析) • 当前读
– 对表/记录加锁
– 同一事务所有的锁链成链表 • I/U/D
– 加锁
– 记录undo日志/redo日志 • 数据持久化
– 事务commit • 需要哪些操作 • 数据回滚
– 事务rollback • 需要哪些操作
InnoDB事务-XA事务
Why XA – 为了保证InnoDB redo log与MySQL binlog的一致性 – backup
XA Commit流程
– InnoDBprepare - Binlog commit - InnoDB commit
– Binlog作为事务协调器 – Transaction Coordinator
– 参数 – MySQLsync_binlog – InnoDBinnodb_flush_log_at_trx_commit
Group Commit – MariaDB/Percona 5.5.19-rel24/MySQL 5.6 InnoDB事务-mini-transaction
mini-transaction(微事务) – 定义 • mini-transaction不属于事务InnoDB内部使用 • 对于InnoDB内所有page的访问(I/U/D/S)都需要mini-transaction支持 – 功能 • 访问page对page加latch ( 只读访问 S latch 写访问 X latch) • 修改page写redo日志 (mtr 本地缓存 ) • page操作结束提交mini-transaction ( 非事务提交 ) – 将redo日志写入log buffer – 将脏页加入Flush List链表 – 释放页面上的 S/X latch– 总结 • mini-transaction保证单page操作的原子性(读/写单一page) • mini-transaction保证多pages操作的原子性(索引SMO/记录链出多pages访问的原子性) InnoDB锁
– 锁结构/类型/功能
– 锁等待/死锁检测
– 自增序列锁(autoinc lock)
– 半一致读(semi-consistent read)
– 隐式锁(implicit lock)
InnoDB锁-定义 数据库中常用锁类型(Lock/Latch/Mutex)
– 相同 • 都是用来锁住一个资源 – 不同 • Lock (事务锁)
– 实现复杂功能多样可大量/长时间持有
– 支持死锁检测 – 用途锁用户记录/表 • Latch (页面锁)
– 实现相对简单功能相对简单少量/短时间持有
– 不支持死锁检测
– 用途Latch page防止访问时页面被修改/替换(pin) • Mutex (临界区锁)
– 最为简单(CAS, TAS); 功能简单极短持有时间
– 无死锁检测 – 用途保护critical section(临界区)
InnoDB锁-结构 lock_sys(Rec lock hash)
– InnoDB的行锁通过hash表管理
– hash值通过[space, page_no]计算同一页面在同一hash bucket中
– 思考表锁呢 • lock_struct – trx_locks 属于同一事务的锁链表
– type_mode 加锁模式 • 一个锁对象一个加锁模式 – hash 记录锁在hash表中的指针
– index 锁对应的索引 – rec_lock/tab_lock: 以上属于表锁/行锁共用结构此处为不同结构
InnoDB锁-结构(cont.) lock_rec_struct
– InnoDB行锁特殊结构 – InnoDB行锁实例对应于一个索引页面中的所有记录 n_bits page_dir_get_n_heap(page) LOCK_PAGE_BITMAP_MARGIN; n_bytes 1 n_bits / 8; lock mem_heap_alloc(trx-lock_heap, sizeof(lock_t) n_bytes); – 行锁实例的最后是n_bytes的bitmap • bitmap的下标对应于page中的heap_no(记录唯一) • bitmap1heap_no记录加锁
InnoDB锁-行锁
行锁 – 行锁实例 • 对应 Index Page (聚簇 非聚簇) – 行锁标识 • 记录在page中的heap_no – heap_no • 记录插入page分配 • 删除记录重用heap_no可重用 • heap_no与slot_no不同 • heap_no不可用来查找记录 – 行锁实例(右图) • 根据查询条件行锁实例bitmap 的136 bits设置为1对应于 heap_no 136号记录 InnoDB锁-行锁开销 锁开销接近Oracle InnoDB 宣称自己的行锁代价接近于 Oracle 一条记录用 1 bit 即可实 际情况呢 InnoDB 的行锁对象管理一个 Page 行锁上的 1 bit 对应 Page 中的一条记录。一个 400 条记录的 Page 一个行锁对象大小约为 102 bytes 。 锁一行 : 代价 为 102 bytes/ 行 锁 400 行 : 代价 为 102 bytes/400 2 bits/ 行。 • 实际情况 – 锁一行代价巨大(如何优化后续揭晓) – 锁一页代价较小
InnoDB锁-锁模式 数据锁模式
– 数据锁仅仅锁住数据
LOCK_IS, LOCK_S, LOCK_IX, LOCK_X – 意向锁LOCK_IS, LOCK_IX • 表级锁加记录锁前必须先加意向锁 • 功能 杜绝行锁与表锁相互等待 非数据锁模式
– 不锁数据标识数据前GAP的加锁情况非数据锁与数据锁之间不冲突 – LOCK_ORDINARY • next key锁同时锁住记录(数据)并且锁住记录前面的Gap – LOCK_GAP • Gap锁不锁记录仅仅记录前面的Gap – LOCK_NOT_GAP • 非Gap锁锁数据不锁Gap – LOCK_INSERT_INTENSION • Insert操作若Insert的位置的下一项上已经有Gap锁 则获取insert_intension锁等待Gap锁释放 – LOCK_WAIT • 当前锁不能立即获取需要等待
– 非数据锁兼容模式 InnoDB锁-实例分析 InnoDB锁-加锁总结 InnoDB锁-等待 InnoDB锁-死锁检测
死锁检测 – 加锁需要等待则触发死锁检测 – 死锁检测由用户线程处理 – 构造Wait-For-Graph (WFG) – 深度优先遍历 (递归) • 后续改为非递归实现(栈) – 死锁检测过程中持有kernel_mutex • 后续MySQL版本中新增lock_sys-mutex – 根据事务权重选择牺牲者 • 事务权重undo日志量 锁数量
InnoDB锁-分裂/合并/迁移 锁分裂 – 索引页面分裂 - 锁分裂 • 锁合并 – 索引页面合并 - 锁合并 • 锁迁移 – 插入记录 • Gap锁从插入后项迁移到新插入项 – 删除记录 • Gap锁从删除项迁移到删除后项
InnoDB锁-Autoinc锁
自增序列锁(Autoinc Lock) – 功能 • 复杂insert语句statement binlog下保证master-slave一致性 – 自增序列并发控制 • mutex 简单Insert/replace语句 • Autoinc_lock insert into select * from 语句 – 参数设置 • innodb_autoinc_lock_mode – 012
InnoDB锁-半一致读
Semi-Consistent Read(半一致读) – 目标 • 提高系统并发性能减少锁等待 – 方案 • 当前读可读取记录历史版本 • 不满足查询条件的记录可提前放锁 – 前提 • Read Committed隔离级别 • innodb_locks_unsafe_for_binlog
InnoDB锁-隐式锁
Implict Lock(隐式锁)
– 目标 • 减少Insert时加锁开销减少锁内存消耗 • 降低锁一行记录的情况( 锁一行代价巨大 ) – 方案 • Insert时不加锁(Implict lock) • 后续scan(当前读)如果碰到Implicit lock则转换为Explicit lock • 延迟加锁 – Implicit Lock判断 • 聚簇索引 – 根据记录上的trx_id判断(trx_id 是否为活跃事务 ) • 二级索引 – 根据索引页面上的max_trx_id 回聚簇索引判断 (max_trx_id 是否小于最小活跃事务 )
– 存在bug
InnoDB多版本
– ReadView
– 聚簇索引/二级索引
– 快照读
– Index Only Scan
– RC vs RR
– Purge
InnoDB多版本定义
一 条语句能够 看到 ( 快照读 ) 本 语句开始时 (RC)/ 本 事务开始时 (RR) 已 经提交的 其他事务所做的修改 – 快照读 • 读记录历史版本而非当前更新未提交版本 • 无需加锁lock free • 语句级(RC)语句开始时的快照 – 语句级ReadView • 事务级(RR)事务开始时的快照 – 事务级ReadView – 看到 • 已提交的Insert/Update后项可见并返回 • 已提交的Delete/Update前项可见并略过
• ReadView 所谓 ReadView 是一个事务的集合这些事务在 ReadView 创建时是 活跃的 ( 未提交 / 回滚 ) read_view_struct – low_limit_no • 提交时间早于此值(trx-no low_limit_no)的事务可以被purge线程回收 • low_limit_no trx_sys-max_trx_id – low_limit_id • 此值(trx-id low_limit_id)的事务当前ReadView均不可见 • low_limit_id trx_sys-max_trx_id – up_limit_id • 此值(trx-id up_limit_id)的事务当前ReadView一定可见 • up_limit_id ReadView创建时系统中最小活跃事务ID – trx_ids[] • 系统中所有活跃事务id组成的数组 • 创建ReadView
– 获取kernel_mutex • 遍历trx_sys的trx_list链表获取所有活跃事务创建ReadView
– Read Committed • 语句开始创建ReadView
– Repeatable Read • 事务开始创建ReadView ReadView创建 RC VS RR InnoDB多版本-记录组织
聚簇索引记录 – DB_TRX_ID • 生成此记录的事务ID
– DB_ROLL_PTR • 此记录历史版本的指针
– Delete_Bit(未给出) • 二级索引记录
– Delete_Bit – 索引页面有DB_MAX_ID • 标识修改索引页面的最大事务ID InnoDB多版本-更新 目的
– 测试各种更新场景下聚簇索引记录/二级索引记录的变化 • 准备 create table test (id int primary key, comment char(50)) engineinnodb; create index test_idx on test(comment); insert into test values (1, ‘aaa’); insert into test values (2, ‘bbb’);
更新主键
update test set id 9 where id 1; – 旧记录标识为删除
– 插入一条新纪录
– 新旧记录前项均进入回滚段
更新非主键
update test set comment ‘ccc’ where id 9; InnoDB更新总结– 更新主键聚簇索引/二级索引均无法进行in place update均会产生 两个版本 – 更新非主键聚簇索引可以in place update二级索引产生两个版本 – 聚簇索引记录undo二级索引不记录undo – 更新聚簇索引记录旧版本会进入Rollback Segment Undo Page – 更新二级索引同时需要判断是否修改索引页面的MAX_TRX_ID – 属于同一事务的undo记录在undo page中保存逆向指针
InnoDB多版本-可见性 InnoDB多版本-Cluster Index Scan
聚簇索引扫描
– 当前读 • 加锁读取记录最新版本 • 通过记录的DB_TRX_ID判断 是否存在Implicit lock – 快照读 • 不加锁 • 根据ReadView读取可见版本 – Index Only Scan • 一定为Index Only Scan 二级索引扫描
– 当前读 • 加锁(二级索引/聚簇索引) • 读取记录最新版本 • 通过page上的MAX_TRX_ID判断 是否可能存在Implicit lock – 快照读 • 不加锁 • 读取记录唯一可见版本 – 如何过滤同一记录的不同版本 – Index Only Scan • cont. Index Only Scan
– 当前读 • 不能进行Index Only Scan – 当前读需要对聚簇索引记录加锁 – 当前读需要访问聚簇索引读取记录所有列 – 快照读 • 访问索引不存在的列
– 不能进Index Only Scan • 仅仅访问索引列
– 二级索引page的MAX_TRX_ID不可见- 不能进行Index Only Scan » 此概率较小
– MAX_TRX_ID可见 - 可进行Index Only Scan » 此概率极大
InnoDB多版本-实例讲解
MySQL Bugs 65745 UPDATE on InnoDB table enters recursion, eats all disk space 原因分析
– 更新主键字段二级索引同样会产生Halloween问题 Purge
– 功能 • 回收索引页面中被删除 且不会被其他事务看到的项 – 实现流程 • 拷贝trx_sys ReadView链表中最老 的read_view作为purge_read_view • 遍历InnoDB系统中所有的Rollback Segment 取出最老的提交事务 • 若purge_read_view.low_limit_no old_trx.no 说明对应的事务可以被purge • 反向遍历事务的undo日志 构造索引记录查询并删除 – 参数/优化 • innodb_max_purge_lag() • innodb_purge_threads (since MySQL 5.6.2) • InnoDB事务/锁/多版本总结 RR vs RC
– Read Committed • 优势
– 高并发低锁开销semi-consistent read – no gap lockearly unlock • 劣势
– 不支持statement binlog – 语句级快照读每条语句新建ReadView – Repeatable Read • 优势 – 支持gap lockstatement binlog – 事务级快照读一个事务对应一个ReadView • 劣势 – 并发冲突高加锁冲突更为剧烈 – 不支持semi-consistent read不支持early unlock
事务Commit流程 – prepare • 将redo日志从log buffer写入log file并flush – innodb_flush_log_at_trx_commit – commit • 处理事务产生的undo pages – insert undo pages直接回收 – 获取事务的trx-no (标识提交顺序) – update undo pages链入history list等待purge • 释放事务持有的锁 – 唤醒必要的等待者 • 关闭事务的read_view • 将redo日志写出并flush – innodb_flush_log_at_trx_commit
事务Rollback流程 – 反向遍历undo日志并应用 • undo操作需要记录redo (undo的补偿日志) – 以下流程与commit一致 • 处理事务产生的undo pages • 释放事务锁 • 关闭read_view • 将redo日志写出并flush