一文解读MySQL Query Cache使用与实现

摘要：查询缓存（QC）像一把双刃剑。在读多写少、重复查询多的场景中，QC能显著提升性能。然而，在写多读少的场景中，QC不仅消耗内存资源，还会因为查询缓存和缓存命中判断等额外步骤导致性能下降。

摘要：查询缓存（QC）像一把双刃剑。在读多写少、重复查询多的场景中，QC能显著提升性能。然而，在写多读少的场景中，QC不仅消耗内存资源，还会因为查询缓存和缓存命中判断等额外步骤导致性能下降。

本文分享自华为云社区《【华为云MySQL技术专栏】MySQL Query Cache使用与实现-云社区-华为云》，作者：GaussDB 数据库。

查询缓存（Query cache，简称QC）是一种数据库优化技术，用于存储查询结果，以便在相同查询再次执行时能够快速返回结果，而无需重新执行查询。MySQL也有QC对应实现，但因其实现存在并发性能差、缓存命中率低等问题，该特性在MySQL 5.7.20标记为不推荐使用，在MySQL 8.0.3里被删除。

QC对于特定场景可以显著提升性能，TaurusDB保留QC并对其并发性能进行了优化。本文基于MySQL 8.0.2代码对QC的使用与实现进行分享，介绍TaurusDB如何进行优化。

在使用QC特性后，MySQL服务端会缓存符合条件（见文末链接）的查询与查询结果。

接收查询后，不会立刻解析和执行，而是优先从QC中检索结果返回。

QC是全局的，不同session可以共享QC功能，更详细介绍参考文末官网链接。

图1 QC缓存、命中流程图

QC相关系统参数

相关参数都包含query_cache关键字，用如下SQL查询。

mysql> show variables like '%query_cache%';

表1 QC系统参数说明

QC功能开启前提query_cache_type!=off且query_cache_size!=0，具体参数使用见官网说明。

QC相关统计参数

相关参数都包含Qcache关键字，用如下SQL查询。

表2 QC统计参数说明

QC底层是一个内存池，所以包含内存池状态参数。上述参数反应当前QC的使用状态，以供使用者调整优化。如：

（1）Qcache_hits/(Qcache_hits+Qcache_inserts)可视作缓存命中率，过低说明QC功能对当前业务作用不大，可考虑关闭QC。

（2）Qcache_free_block/Qcache_total_block可视作缓存碎片率，过高可使用flush query cache进行碎片整理或根据业务适当减小query_cache_min_res_unit。

图2 内存池状态（1）

第二种，查询命中，从 QC 中直接返回查询结果。

图3 内存池状态（2）

第三种，查询失效。发生影响缓存结果正确性的操作时（如相关表DDL、DML），对应缓存失效。

图4 内存池状态（3）

QC的业务实现和内存池有着密切的关系。为了更好理解QC实现，后文将从内存池设计和QC业务实现两方面进行介绍。需要注意，两者在代码层面不是割离的，都在一个全局对象Query_cache中实现。在设计层面，内存池的方案选择也会受到QC业务影响。

内存池的实现，会先申请一整块连续内存，但在处理申请、释放内存的请求后，整块内存逐渐会被分割为多个内存块（block）。根据内存块是否正在使用，可分为空闲内存块（free block）与非空闲内存块（used block）。

图5 内存池变化图

通过图5可以发现，内存池核心接口是内存的申请与释放，并且在内存池使用过程中会出现内存碎片化问题。

那么申请内存时，如何找到内存池中不小于所需大小的空闲块？如何知道各内存块的大小和空闲状态？如果有多个合适的空闲块，如何选择？如果选中的空闲块比申请的大，多余的空间（内部碎片）怎么处理？释放内存时，又该如何处理释放的内存块？

下面将分析QC如何解决上述问题，同时缓解内存的碎片化。

图6 内存块抽象图

如图6所示，QC内存池将内存块大小、类型等元信息存储在块头部。用数组（bins）根据块大小对空闲内存块进行管理。

class Query_cache {Query_cache_memory_bin *bins;};// 一个bin元素维护一条空闲内存块链表，链表有如下特征（设当前数组下标为i）：// 1、链表管理块大小范围在bins[i].size ~ bins[i-1].size之间；// 2、链表中空闲内存块从小到大有序；// 3、链表为双向链表，并且头尾相连。struct Query_cache_memory_bin {Query_cache_block *free_blocks; // 空闲内存块链表ulong size; // 链表管理块大小范围下限，最小为512Buint number; // 当前链表长度 };

数组长度与成员赋值根据内存池大小经过内部算法确定，算法有如下特征：

图7 free block管理

（1）数组成员下标越小管理的空闲内存块大小越大。如图7左边所示，bins[0]管理空闲内存块大小大于bin[1]管理的。

（2）数组成员下标越大管理的空闲内存块大小范围越小。如图7左边所示，bins[1]管理空闲内存块是5-8M，范围是3M，而bins[3]管理空闲内存块是1-2M，范围是1M）。

考虑到小对象往往会分配更频繁，越可能是性能瓶颈，所以算法会生成更多bin元素对小内存块进行更加细致的管理。

设当前内存池大小为128M，经过一段时间运行后，如图7右边所示（链表首尾相连，图中未画）。

若申请大小为6M，当前有多个内存块符合申请大小。如图8所示，通常有如下选择策略：

图8 内存池物理、逻辑结构

第一种策略，first fit。

在物理上进行遍历，返回第一个不小于申请大小free block（10M）。此策略寻找空闲内存块时间比较短，但块大小可能超出6M较多，易造成内存碎片。

第二种策略，best fit。

best fit返回最小不小于申请大小free block，可利用bins数组查找：

（1）根据申请大小找到对应的bin元素（6M对应bins[1]）。

（2）遍历bin中free block链表，因链表有序，返回第一个不小于申请大小的块（8M）。

初看best fit是一个不错的方案，但如果free block链表长度过长，时间会线性增加。因此，QC在best fit基础上进行优化，将第二步的链表遍历修改为：从链表头向后（从小到大）遍历最多5次，若找到符合要求内存块返回，否则从链表尾向前（从大到小）遍历最多5次，返回这五个内存块中最小符合要求的内存块。

若申请8M内存块，但写入数据只有6M，则会出现了2M的内部碎片，如图9所示。若不处理，将影响内存利用率。

图9 内部碎片处理

QC的处理方式：如果内部碎片不大于512B不进行处理，否则将内部碎片从内存块中分离，视作新增的free block纳入bins中管理。

内存释放除了需要重置内存块后纳入对应bin管理，还需合并相邻的空闲内存块，以减少内存碎片。

图10 内存释放处理

如图10中所示，若释放内存块大小为7M，物理相邻内存块也是空闲，从左到右即为内存池的变化过程。

关键数据结构

关键数据结构就是前文常提的抽象概念内存块，对应代码中的Query_cache_block。

struct Query_cache_block {block_type type; // 块类型，主要可分为query\table\result blockulong length, used; // 块大小、块已使用大小Query_cache_block *pnext,*pprev, // 块物理前后指针 *next,*prev; // 块逻辑前后指针，不同块类型有不同使用方式int n_tables; // 块中Query_cache_block_table数组个数// 获取第n个Query_cache_block_tableinline Query_cache_block_table *table(TABLE_COUNTER_TYPE n); inline uchar* data; // 获取块的data起始地址inline Query_cache_query *query; // 将data以query block方式解析inline Query_cache_table *table;// 将data以table block方式解析inline Query_cache_result *result;// 将data以result block方式解析};

图11 block内存结构

图11中，元信息中Query_cache_block_table数组，作用是维护block之间关联关系，具体用法后文分析。

根据data存储内容不同，block主要被分为三种类型query,table,result block。

我们用一个简单SQL的执行作为例子，如查询：select * from t1 join t2 where t1.a = t2.a，来探究一个查询在内存池中对应哪些block。

query block

图12 query block结构图

图12中，一个查询对应一个query block，data记录查询SQL与查询状态（影响输出参数）。

query block中有t1、t2的Query_cache_block_table链表节点，与t1、t2的table block关联（table block中解释关联作用）。

Query_cache_query记录元信息，如查询对应的result block指针。

table block

图13 table,query block关系图

图13中，一张表对应一个table block，data记录数据库名和表名。

table block有Query_cache_block_table链表头节点与相关的query block相连，方便后续通过库表名找到相关query block。

result block

图14 查询结果写入流程图

图14中，result block的data记录MySQL返回客户端的packet内容.

因为packet的发送可能分为多次，所以result block在初次申请内存时，无法确定最终大小，这会导致一个查询可能对应的多个result block的情况，同一个查询的result block之间使用指针维护一个链表。

当查询一对应2个result block时，table,query,result block之间对应的关系图如图15所示。

图15 table，query，result block关系图

图16 QC流程图

缓存查询实现

对应图16中，若QC未命中分支，主要有2个步骤：

步骤一，QC存储查询内容。

通过调用Query_cache::store_query，创建query,table block，并维护对应的哈希表和链表。

步骤二，QC存储查询结果。

通过调用query_cache_insert，基于MySQL向客户端返回的packet内容生成result block，可参考查询结果写入流程图（图14）。

缓存命中实现

对应图16中，若QC命中分支，主要有1个步骤，即QC命中判断：在解析前调用Query_cache::send_result_to_client，使用query block哈希表来判断查询是否命中。若命中则直接调用函数net_write_packet，对客户端发送缓存结果。

缓存失效实现

缓存失效场景，相关表发生ddl、dml、内存池不足导致缓存失效等。参考图15（table,,query,result block关系图），dml的缓存失效流程如下：

（1）通过库表名在table block的哈希表中找到table block；

（2）通过table block中Query_cache_block_table链表头找到与此表相关query block；

（3）根据query block的result block指针，找到对应的result block；

（4）对上述block进行释放。

内存池整理命令

QC提供了命令FLUSH QUERY CACHE，可手动触发内存池空间整理。分为两个步骤：

第一，pack cache，将free block移动到内存池底部。

第二，join result，将属于同一查询的多个result block（result1.1，result1.2）进行合并，此操作将导致内存碎片重新出现，需再进行一次pack cache。

图17 内存池空间整理

如图17所示，整理后内存池只有1个free block，也对result block进行了整合。

并发处理

为了应对MySQL的并发查询，QC内存池需设计并发策略来保证QC业务的正确性。

QC锁

要求所有对内存池的操作（插入、删除、查询）需提前持有QC锁。其实质是将并发操作序列化，以保证正确性；

查询结果写入持锁优化

根据图14（查询结果写入流程图），对查询结果写入的持锁范围进行了优化——不需全程持锁，在进行result block写入时持锁即可。

图18 写入流程优化

写入流程不需全程持锁，只需对内存池真正操作的 Query_cache::insert函数中持锁即可。但此优化引入一个新问题：如果同时有两个会话进行相同的查询，可能会导致两个线程对查询结果共同写入的情况，造成缓存结果错误。

此优化引入一个新问题：同时有两个会话进行相同查询，造成两个线程对同一查询结果同时写入的情况，造成缓存结果错误。

解决方案：

在query block中新增成员变量writer，创建query block时，writer记录线程号，后续result block只能由该线程写入。这样就可以确保每个查询结果，只能由一个线程写入，从而避免缓存结果的错误。

事务场景

1）多语句事务:

单语句事务和多语句事务中，相同查询对应不同的缓存。

-- 查询1进行缓存select * from t1;begin;-- 查询2进行缓存select * from t1;

2）行锁写锁:

表有行写锁时，不会进行缓存。

begin;insert into t1 values(1);-- 不会缓存select * from t1;

3）RC场景:

DML、DDL操作会对相关查询缓存失效，所以,QC中查询缓存都是最新提交的结果，符合读已提交的定义，RC可以正常使用QC特性。

4）RR场景:

为了适配RR隔离级别，在表元数据中新增变量（query_cache_inv_id）记录对表的最新操作的事务ID(trx_id)。如果RR事务.trx_id

-- session 1begin;select * from t2; //开启事务1，设trx_id=1-- session 2insert into t1 values(1); //t1的query_cache_inv_id设置为当前trx_id（2）begin;select * from t1; //缓存查询-- session 1select * from t1; //事务1.trx_id

本章对内存池设计和QC业务设计的原理进行了分析，并总结了各自的优缺点。

内存池设计优点：

1. 利用数组（bins）、链表结构，以内存块大小管理空闲内存，申请内存高效；

2. 内部碎片及时处理、释放内存时将物理相邻free block合并，自动优化内存池；

3. 提供FLUSH QUERY CACHE命令可手动触发整理内存池。

内存池设计缺点：

1.内存池大小无法动态调整，调整大小会重新初始化，丢失缓存数据；

2.不支持并发操作内存池，使用QC锁使操作序列化，高并发场景性能下降严重。

查询业务设计优点：

1. 将block分类，利用链表、哈希表等结构，简洁实现查询缓存、命中、失效等功能；

2. 查询结果可分在多个result block存储，提升内存利用率；

3. 查询结果写入流程中减少QC锁持有的时间，提升性能；