基于TreeLSTM的查询基数估计 |
| |
引用本文: | 齐凯阳,于炯,何贞贞,苏子航.基于TreeLSTM的查询基数估计[J].东北师大学报(自然科学版),2024(1):55-64. |
| |
作者姓名: | 齐凯阳 于炯 何贞贞 苏子航 |
| |
作者单位: | 1. 新疆大学软件学院;2. 新疆大学信息科学与工程学院 |
| |
基金项目: | 国家自然科学基金资助项目(61862060,61462079,61562086,61562078); |
| |
摘 要: | 针对传统的数据库管理系统无法很好地学习谓词之间的交互以及无法准确地估计复杂查询的基数问题,提出了一种树形结构的长短期记忆神经网络(Tree Long Short Term Memory, TreeLSTM)模型建模查询,并使用该模型对新的查询基数进行估计.所提出的模型考虑了查询语句中包含的合取和析取运算,根据谓词之间的操作符类型将子表达式构建为树形结构,根据组合子表达式向量来表示连续向量空间中的任意逻辑表达式.TreeLSTM模型通过捕捉查询谓词之间的顺序依赖关系从而提升基数估计的性能和准确度,将TreeLSTM与基于直方图方法、基于学习的MSCN和TreeRNN方法进行了比较.实验结果表明:TreeLSTM的估算误差比直方图、MSCN、TreeRNN方法的误差分别降低了60.41%,33.33%和11.57%,该方法显著提高了基数估计器的性能.
|
关 键 词: | 基数估计 数据库管理系统 查询优化器 神经网络 长短期记忆网络 |
|
|