摘 要: | 针对大数据库中正则表达式查询,提出了一种基于索引的有效算法。首先,构造索引。该索引结构在前缀树基础上加以改进,为每个节点创建二维数组存放该节点所辖子树各层的首次关键节点,并对每个节点附加关键节点指针以指向同层的下一关键节点。然后,通过所提出的索引结构进行查询。最后,分析了所提出算法的时间和空间复杂度,并进行了实验。实验结果证明:随着数据集的增加,其查询时间和输入/输出(I/O)时间增长速度较缓慢,说明其可扩展性较好,适合于大数据库中正则表达式查询。并且,随着查询字串的增加,查询时间与I/O时间均呈递减趋势,证明了该算法的效率和有效性。
|