首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于分解的向量空间模型的Web新闻信息检索
引用本文:王卫东,宋丹,宋人杰.基于分解的向量空间模型的Web新闻信息检索[J].山东大学学报(理学版),2006,41(3):135-138.
作者姓名:王卫东  宋丹  宋人杰
作者单位:1. 东北电力大学,计算机系,吉林,吉林,132012
2. 大连理工大学,计算机科学与工程系,辽宁,大连,116024
摘    要:在分析了传统向量空间检索模型的不足的基础上,给出了一种利用分解的向量空间模型进行Web新闻信息检索的方法.该方法没有使用传统向量空间模型中的单个向量,而是按照语义将特征词划分为4个组(人物,时间,地点,内容)并形成4个向量空间,每个空间进行独立的权重计算和相似度计算.而且将报道中的时间信息标准化,利用地理知识将报道中的地点特征词扩充,并利用这些信息进行检索.实验证明这些方法是有效的.

关 键 词:信息检索  向量空间模型  时间  地点  人物  内容
文章编号:1671-9352(2006)03-0037-04
收稿时间:2006-03-31
修稿时间:2006年3月31日

Web news retrieval based on splited vector space model
WANG Wei-dong,SONG Dan,SONG Ren-jie.Web news retrieval based on splited vector space model[J].Journal of Shandong University,2006,41(3):135-138.
Authors:WANG Wei-dong  SONG Dan  SONG Ren-jie
Institution:1. Department of Computer Science, Northeast Dianli Univ., Jilin 132012, Jilin, China; 2. Department of Computer Science, Dalian University of Technology, Dalian 116024, Liaoning, China
Abstract:Based on the analysis of the deficiency of the traditional vector space retrieval model,a Web News Retrieval approach is presented based on splited vector space model.Instead of using a single term vector as event representation,the terms into four semantic classes are split(names,temporal expressions,spatial terms and contents) according to the semantic diffirence of them,form four vector spaces,and process and weigh the classes separately.Temporal expressions and augment spatial terms with geog-raphy information are formalized and this data in the retrieval is used.The approach is motivated by experiment.
Keywords:information retrieval  vector space model  temporal expressions  spatial terms  names  contents
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《山东大学学报(理学版)》浏览原始摘要信息
点击此处可从《山东大学学报(理学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号