首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向大数据库正则表达式查询的有效算法
作者单位:;1.郑州航空工业管理学院计算机科学与应用系;2.上海交通大学计算机科学与工程系
摘    要:针对大数据库中正则表达式查询,提出了一种基于索引的有效算法。首先,构造索引。该索引结构在前缀树基础上加以改进,为每个节点创建二维数组存放该节点所辖子树各层的首次关键节点,并对每个节点附加关键节点指针以指向同层的下一关键节点。然后,通过所提出的索引结构进行查询。最后,分析了所提出算法的时间和空间复杂度,并进行了实验。实验结果证明:随着数据集的增加,其查询时间和输入/输出(I/O)时间增长速度较缓慢,说明其可扩展性较好,适合于大数据库中正则表达式查询。并且,随着查询字串的增加,查询时间与I/O时间均呈递减趋势,证明了该算法的效率和有效性。

关 键 词:正则表达式  查询处理  大数据库  索引

An Effective Algorithm for Regular Expression Queries in Large Databases
Abstract:
Keywords:
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号