首页 | 本学科首页   官方微博 | 高级检索  
     检索      

SCC--利用分类技术改进的短摘要比较方法
引用本文:龚笔宏.SCC--利用分类技术改进的短摘要比较方法[J].清华大学学报(自然科学版),2005,45(9):1806-1809.
作者姓名:龚笔宏
作者单位:北京大学,计算机科学技术系,北京,100871
基金项目:国家自然科学基金重点资助项目(60435020);教育部博士点基金资助项目(20030001076)
摘    要:搜索引擎返回结果的摘要的特点在于文档长度短,大部分关键字最多只出现一次,因此传统文档比较方法所使用的TF-IDF、夹角余弦等方法对摘要比较失去了作用.为了改进传统文档比较方法,该文利用分类技术对短摘要信息进行扩充,以改进摘要比较.将两个摘要分别与参照物进行比较,在较大的一个文档集合中找到与摘要相近的文档集合.用这些文档集合扩充短摘要的含义,以替代短摘要来衡量摘要相似度.实验结果表明,使用改进后的摘要比较算法,相关集合的DCG指标有了明显改进.

关 键 词:信息检索  文档比较  摘要  用户反馈
文章编号:1000-0054(2005)S1-1806-04
修稿时间:2005年5月23日

SCC: An approach to improve snippets comparison by classification
GONG Bihong.SCC: An approach to improve snippets comparison by classification[J].Journal of Tsinghua University(Science and Technology),2005,45(9):1806-1809.
Authors:GONG Bihong
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号