首页 | 本学科首页   官方微博 | 高级检索  
     检索      

中文搜索引擎中的分词技术研究
引用本文:房志峰.中文搜索引擎中的分词技术研究[J].科学技术与工程,2008,8(9):2481-2484.
作者姓名:房志峰
作者单位:山东政法学院信息科学技术系,济南,250000
摘    要:分词模块是中文搜索引擎的一个重要组成部分,针对分词提出了一种最短路径与共首字歧义词概率的比较相结合的方法,首先寻找最短路径.如果最短路径不只一条,就比较共首字歧义词概率,选择概率较大的一条路径,效果非常明显.对未登录词识别提出了一种改进的移动窗口算法,在单字序列中移动窗口,并记录状态来寻找新词,能够识别大部分的未登录词.

关 键 词:中文分词  未登录词识别  最短路径  共首字歧义词概率  窗口移动法
修稿时间:2007年12月27

Study on the Segmentation of Chinese Search Engine
FANG Zhi-feng.Study on the Segmentation of Chinese Search Engine[J].Science Technology and Engineering,2008,8(9):2481-2484.
Authors:FANG Zhi-feng
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号