首页 | 本学科首页   官方微博 | 高级检索  
     

一种改进的中文分词歧义消除算法研究
引用本文:许高建,胡学钢,路遥,王庆人. 一种改进的中文分词歧义消除算法研究[J]. 合肥工业大学学报(自然科学版), 2008, 31(10)
作者姓名:许高建  胡学钢  路遥  王庆人
作者单位:安徽农业大学,信息与计算机学院,安徽,合肥,230036;合肥工业大学,计算机与信息学院,安徽,合肥,230009;合肥工业大学,计算机与信息学院,安徽,合肥,230009;安徽农业大学,信息与计算机学院,安徽,合肥,230036
基金项目:国家高技术研究发展计划(863计划),安徽省科技厅科技攻关项目,安徽农业大学校科研和教改项目
摘    要:随着信息技术的飞快发展,今天的互联网上信息已成爆炸式增长,文本挖掘技术成为目前研究的热点.文章概述了中文分词的算法,通过介绍歧义存在的种类,分析了分词结果歧义性存在的必然性;在中文分词基础上,提出了一种采用"动词优先"的歧义消除算法,使分词结果最大程度地消除歧义,从而提高了分词的精度,为文本挖掘之后的环节打下了基础.

关 键 词:文本挖掘  中文分词  歧义  歧义消除

Study on an improved ambiguity elimination algorithm of Chinese text segmentation
XU Gao-jian,HU Xue-gang,LU Yao,WANG Qing-ren. Study on an improved ambiguity elimination algorithm of Chinese text segmentation[J]. Journal of Hefei University of Technology(Natural Science), 2008, 31(10)
Authors:XU Gao-jian  HU Xue-gang  LU Yao  WANG Qing-ren
Abstract:With the rapid development of information technology,the information on Internet has been greatly increased.The text mining technology is focused on at present as a hot issue.This paper summarizes the algorithms of Chinese text segmentation.Through the introduction of the kinds of ambiguities,it analyzes the necessity of the existence of ambiguities.On the basis of Chinese text segmentation,it offers a new ambiguity elimination algorithm based on verb priority.By means of this algorithm,to eliminate ambiguities to a great extent can be achieved so as to improve the segmentation precision.This study is valuable for the text mining studies.
Keywords:text mining  Chinese text segmentation  ambiguity  ambiguity elimination
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号