首页 | 本学科首页   官方微博 | 高级检索  
     

Dynamic Hash TRIE算法的研究与分析
引用本文:杨来,何清,许立达,史忠植. Dynamic Hash TRIE算法的研究与分析[J]. 广西师范大学学报(自然科学版), 2008, 26(1): 134-138
作者姓名:杨来  何清  许立达  史忠植
作者单位:中国科学院计算技术研究所,智能信息处理重点实验室,北京,100080;中国科学院,研究生院,北京,100039;中国科学院计算技术研究所,智能信息处理重点实验室,北京,100080
基金项目:国家高技术研究发展计划(863计划) , 国家重点基础研究发展计划(973计划) , 国家自然科学基金 , 北京市自然科学基金
摘    要:分词是中文信息处理的基础,词典查询又是分词的基础。另外,搜索引擎需要对访问过的URL进行唯一性检测。针对汉语词典查询和唯一性检测这两个问题,提出Dynamic Hash TRIE词典算法,有效地压缩了节点,没有单链树枝。通过Java和C++编程实验,对比了多个同类算法,证明该算法对于中文词典具有较高的查询性能,灵活的可拓展性。另外还提出了一个词库测试的标准Norm Test,可以排除机器性能的干扰来对比各种算法。

关 键 词:机器检索  唯一性  程序设计  自然语言处理
文章编号:1001-6600(2008)01-0134-05
修稿时间:2008-01-15

Research and Analysis of Dynamic Hash TRIE Algorithm
YANG Lai,HE Qing,XU Li-da,SHI Zhong-zhi. Research and Analysis of Dynamic Hash TRIE Algorithm[J]. Journal of Guangxi Normal University(Natural Science Edition), 2008, 26(1): 134-138
Authors:YANG Lai  HE Qing  XU Li-da  SHI Zhong-zhi
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号