InnoDB的数据结构交流

连接器

  • 由一个工作线程去从一个网络连接中读取SQL语句
  • IO模型:IO多路复用。扩展:五种网络IO模型

解析器

  • SQL接口(SQL Interface):执行SQL语句
  • 查询解析器(Parser):对SQL语句进行拆分解析
  • 查询优化器:生成执行计划,选择最优的查询路径

ps:常用定位sql

  • explain sql
  • information_schema.optimizer_trace

执行器:

  • 执行器根据执行计划调用存储引擎的接口

innodb

  • 索引:B+树
  • 支持MVCC
  • 有效地利用以及使用内存和CPU

缓存池(buffer pool)

设置属性

  • innodb_buffer_pool_size: 总容量
  • innodb_buffer_pool_instance: 缓冲池个数

缓存池里的数据结构

  • 缓存页:用来放磁盘数据页
  • hash表:缓存池缓存表,key是表空间号+数据页号, value是缓存页的地址
  • free链表:缓存池空闲表, value是缓存页元数据块
  • flush链表:将缓冲池里更新后的脏页放在链表上供后台线程更新磁盘数据时用
  • lru链表:淘汰链表,当缓存池缓存页不够时将缓存页刷到磁盘,将缓存页更新为空闲页

当一个查询sql执行时

  • 先从hash表查看缓存池中是否含有sql的缓存页信息,如果有直接从缓存池中查询返回。
  • 如果没有则从free链表获取一个空闲块的空闲页,将磁盘页加载进空闲页。从free链表剔除空闲块信息,将该数据页添加进hash表。
  • 将数据加载进lru链表冷数据区头部

当一个更新sql执行时

  • 先从hash表查看缓存池中是否含有sql的缓存页信息,如果没有就从磁盘加载进缓冲池。
  • 对需要更新的数据加索引记录锁,将原值写入undo日志。
  • 更新缓冲池里面数据(磁盘数据未修改),将更新后值命令写入redolog buffer(放redo日志的)。
  • 提交事务,将redo日志写入磁盘文件(数据还未修改), 同时写binlog日志, 最后在redo日志写commit命令。
  • 将缓存池里的缓存页加入flush链表, 后台线程异步随机将缓冲池数据刷新到磁盘
  • 刷新lru链表

redo日志提交策略(innodb_flush_log_at_trx_commit)

  • 0:提交事务不会把redo log buffer里的数据刷入磁盘文件
  • 1:提交事务必须把redo log从内存刷入到磁盘文件, 一般选择这个保证数据强一致性
  • 2: 提交事务把redo日志写入磁盘文件对应的os cache缓存里去, 可能1秒后才会把os cache里的数据写入到磁盘文件

ps:为什么还要有 redolog buffer
ps:redo日志和binlog的区别

lru预读机制和淘汰机制

  • 冷热分离:冷数据区默认37%(innodb_old_blocks_pct)
  • 冷数据区域头部的信息在1s(innodb_old_blocks_time)后访问才会挪动到热区域头部去
  • 淘汰触发时机:定时任务和加载时淘汰

段(segment) -> 区(extent) -> 页(page) -> 行(row)

  • extent是最小申请单位(一般申请4个),page是I/O操作的最小对象,row是data的最小单位
  • 普通表默认每个page是16K,extent的固定大小为1M(64个page)
  • 单个区上物理空间是连续的,不同区不保证连续

row的数据结构
变长字段的长度列表、NULL值列表、数据头、隐藏字段、存储信息

  • 变长字段长度列表: 十六机制, 逆序排列
  • null值列表: 二进制, 1说明是NULL, 0说明不是NULL, 逆序排列
  • 数据头: 40bit(1/2位是预留位, 3是delete_mask, 4是min_rec_mask, 5-8是n_owned,
    9-22是heap_no, 22-24是record_type, 24-40是next_record)
  • 隐藏字段: DB_ROW_ID(隐藏ID)、个DB_TRX_ID(当前事务ID)、DB_ROLL_PTR(undo日志版本号)
  • 存储信息

eg:

name age class no remark
张三 18 9 是一个男生啊啊啊

0x08 0x02 01000 0000000000000000000010000000000000011001 00000000094C 00000000032D EA000010078E 张三189是一个男生啊啊啊

row的数据头结构

  • 1-2:预留位,没任何含义
  • 3:delete_mask,标识的是这行数据是否被删除,在MySQL里删除一行数据的时候会将该标志位置为1,彻底删除(optimize table tablename)
  • 4:min_rec_mask,在B+树里每一层的非叶子节点里的最小值都有这个标记
  • 5-8:n_owned,表示当前槽管理的记录数
  • 9-22:heap_no,当前记录在当前页中的位置从2开始,0-伪记录(最小),1-虚拟记录(最大)
  • 22-24:record_type,行数据的类型,0代表的是普通类型,1代表的是B+树非叶子节点,2代表的是最小值数据,3代表的是最大值数据
  • 25-40:next_record, 下一条数据的指针(页链表),规定最小记录的下一条记录就本页中主键值最小的记录,而本页中主键值最大的记录的下一条记录就是最大记录

page的数据结构

  • 文件头(FIleHeader):38个字节,记录页的通用信息,比如上下页的页号,页类型,所有的数据页其实是一个双链表
  • 数据页头(PageHeader):56个字节, 记录本页存储记录的状态信息,如本页记录数量,槽数量
  • 最小记录和最大记录(Infimum + supremum):26个字节
  • 数据行(User Records):用来放行数据
  • 空闲空间(Free Space):存数据空间中尚未使用的区域
  • 数据页目录(Page Directory):数组,放的是主键与数据的映射关系
  • 文件尾部(File Trailer):8个字节

本文地址:https://blog.csdn.net/weixin_40682142/article/details/110843335

(0)
上一篇 2022年3月21日
下一篇 2022年3月21日

相关推荐