首页 | 本学科首页   官方微博 | 高级检索  
     

基于最大熵算法的全文检索研究
引用本文:张立岩,吕玲,王井阳. 基于最大熵算法的全文检索研究[J]. 河北科技大学学报, 2009, 30(2): 112-115
作者姓名:张立岩  吕玲  王井阳
作者单位:河北科技大学信息科学与工程学院,河北石家庄,050018;河北科技大学信息科学与工程学院,河北石家庄,050018;河北科技大学信息科学与工程学院,河北石家庄,050018
基金项目:河北省科技厅科技攻关项目 
摘    要:全文检索是一种有效的信息检索技术,改进最大熵模型的应用研究在自然语言处理领域中受到关注。笔者利用语料库中词性标注和词频标注的上下文信息,建立基于互信息的最大熵方法的检索系统,研究的重点在于提出一种中文分词算法,并从实际问题出发,采用面向对象和模型驱动的设计方法,将该算法应用于实际的全文检索系统的设计中。

关 键 词:全文检索  最大熵模型  分词
收稿时间:2009-03-09

Rsearch of Chinese full text information retrivial system based on maximum entropy principle
ZHANG Li-yan,LV Ling and WANG Jing-yang. Rsearch of Chinese full text information retrivial system based on maximum entropy principle[J]. Journal of Hebei University of Science and Technology, 2009, 30(2): 112-115
Authors:ZHANG Li-yan  LV Ling  WANG Jing-yang
Affiliation:College of Information Science and Engineering;Hebei University of Science and Technology;Shijiazhuang Hebei 050018;China
Abstract:Chinese full text information retrivial is one of the efficient technologicies of information retrivial,and a lot of researches have been made on the application of the maximum entropy modeling in the natural language processing during recent years.This paper presents a retrivial system based on maximum entropy principle.The context of speech tagging and word frequencytagging included in database are considered,and Chinese word segmentation algorithm is put forward.By adopting object-oriented and the model ...
Keywords:Chinese full text information retrivial  maximum entropy principle  word segmentation algorithm  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《河北科技大学学报》浏览原始摘要信息
点击此处可从《河北科技大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号