关键词:
数据库管理系统
负载预测
参数调优
大语言模型
摘要:
在数字化时代,数据库管理系统(DBMS)作为数据密集型应用的核心组件,其性能优化面临着严峻的挑战,参数调优技术已成为该领域的一个关键研究方向。参数调优旨在快速且高效地识别DBMS中最优的旋钮配置。然而,现有的调优方法因过度依赖DBMS运行时的反馈,或对领域知识的利用不够充分,导致调优效率低下。同时,现有的响应式调优机制难以适应未来工作负载的变化,容易引发性能衰退甚至系统崩溃。本文从现有数据库参数调优所面临的问题入手,提出了针对性的解决方案,主要研究内容如下:
1.提出了一种基于查询与资源的负载预测模型,模型采用流水线式的机器学习方法,对数据库的查询特征和资源特征进行建模与预测。首先,模型利用预处理器和聚类器对数据进行高效处理,以减少预测器所需跟踪的工作负载特征数量。预测器针对于数据库负载的复杂特性及需求,建立基于CNN-Bi LSTM-Attention的预测框架,实现了对数据库查询负载与资源负载在时间序列上的精准预测。
2.提出了一种多大语言模型专家指导的参数调优模型,模型充分利用领域知识来加速数据库旋钮的调优流程。首先,模型采用混合检索增强生成算法,结合多专家协同指导机制,实现知识的高效提取与聚合。然后,模型使用遗传算法对系统级别和查询级别的参数进行粗粒度探索。随后,通过分类和压缩指标,对工作负载级别和旋钮级别的参数进行优化,有效缩减了搜索空间。最后,模型采用优化后的深度强化学习算法来进行细粒度探索,完成旋钮的配置推荐。
最后基于上述内容,实现了基于负载感知的数据库参数调优原型系统,将负载预测模型与参数调优模型进行充分融合。首先,负载预测模型对工作负载进行预测,当预测值到达预设阈值时,触发参数调优模型对数据库的参数进行推荐。通过在Bus Tracker数据集上开展实验,实验结果充分验证了负载预测模型与参数调优模型的有效性,优化后的数据库吞吐量提升了14.7%,延迟降低了11.6%。