首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文全文检索系统中基于分词技术的研究
引用本文:刘畅,张猛.中文全文检索系统中基于分词技术的研究[J].吉林大学学报(信息科学版),2013,31(3):320-323.
作者姓名:刘畅  张猛
作者单位:1. 吉林工商学院 信息工程学院, 长春 130062; 2. 吉林大学 网络中心, 长春 130012
基金项目:吉林省教育厅科技发展规划基金资助项目(2012373)
摘    要:为在保证中文歧义包容和长度限制的同时提高中文全文检索的速率, 在现有中文分词算法的基础上, 提出了一种改进的中文分词算法。通过在算法中建立索引的过程建立文本中相关词与词库的映射, 对词库进行改造, 使之更好地与相关词进行映射, 以便于实现中文分词。实验证明, 改进的中文分词算法能降低检索耗时, 是已有的分词算法的1/2和1/5, 有效提高中文全文检索的速率。

关 键 词:中文全文检索  中文分词  字索引  
收稿时间:2013-02-25

Chinese Full-Text Retrieval System Based on Segmentation Techniques
LIU Chang,ZHANG Meng.Chinese Full-Text Retrieval System Based on Segmentation Techniques[J].Journal of Jilin University:Information Sci Ed,2013,31(3):320-323.
Authors:LIU Chang  ZHANG Meng
Institution:1. Department of Information Engineering, Jilin Business and Technology College, Changchun 130062, China;2. Network Center, Jilin University, Changchun 130012, China
Abstract:In order to raise the rate of Chinese text retrieval of Chinese full text retrieval system on the basis of the Chinese ambiguity inclusiveness and length restrictions, a kind of improved Chinese word segmentation algorithm is proposed based on the existing Chinese word segmentation algorithms. In this improved algorithm the process of indexing establishment makes a mapping from related words to the thesaurus. Through the improvement to the thesaurus, abetter mapping is realized. Experiments show that the improved algorithm is a more efficient Chinese text retrieval segmentation algorithm.
Keywords:Chinese full-text retrieval  Chinese segmentation  character-based indexing  
本文献已被 CNKI 等数据库收录!
点击此处可从《吉林大学学报(信息科学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(信息科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号