首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于Levenshtein算法的题库相似度检测算法的设计与改进
引用本文:胡玉琦.基于Levenshtein算法的题库相似度检测算法的设计与改进[J].东莞理工学院学报,2014(5):57-60.
作者姓名:胡玉琦
作者单位:职工教育培训中心 太原钢铁 集团 公司,太原,030003
摘    要:为快速找到题库中题干重复题或相似度很高的试题,利用java Excel API类配合Levenshtein Distance算法实现直接访问excel题库,设计了题库重复题检测算法。在实际使用过程中发现Levenshtein算法存在内存超限,检测结果输出越界等问题,采用字符串分割法及增加控制语句的方式进行改进,获得了良好的实际使用效果。

关 键 词:Levenshtein算法  重复题  字符串分割

Design and Improvement of Detection Algorithm for Similarity of Questions Bank Based on Levenshtein Algorithm
HU Yu-qi.Design and Improvement of Detection Algorithm for Similarity of Questions Bank Based on Levenshtein Algorithm[J].Journal of Dongguan Institute of Technology,2014(5):57-60.
Authors:HU Yu-qi
Institution:HU Yu-qi (Employee Training and Education Center, Taiyuan Iron & Steel (Group) Co. , LTD, Taiyuan 030003 ,China)
Abstract:To find High similarity of question Bank quickly,Detection algorithm is designed with java Excel API. But there is possible phenomenon,such as memory limit,output bounds of test results,etc. in the actual use of the process. In order to solve these problems,we use String segmentation method and increase Control statement to get good effect.
Keywords:Levenshtein Algorithm  Repetitive question  String segmentation method
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号