首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于综合方法的文本主题句的自动抽取
引用本文:张云涛,龚玲,王永成.基于综合方法的文本主题句的自动抽取[J].上海交通大学学报,2006,40(5):771-774,782.
作者姓名:张云涛  龚玲  王永成
作者单位:1. 上海交通大学,网络信息中心,上海,200030;上海交通大学,电子信息与电气工程学院,上海,200030
2. 上海交通大学,电子信息与电气工程学院,上海,200030
摘    要:提出了基于综合方法的主题句的提取方法,并着重讨论了文本主题概念的提取以及相应的权值体系.根据概念间的相互关系,对同义概念进行语义归并,对上下位概念进行语义聚焦,模拟人工标引专家在分析文本主题时的“兼顾各个方面的主题,同时又有所侧重”的原则.在调整文本主题上下位概念的权值时,既考虑下位概念对上位概念的增强作用,同时又考虑到这种调整不影响整个文本主题的分布,从而更精确地抽取出文本的主题概念.采用多种权重度量方式,综合评估句子反映主题的价值.在此基础上,采用主题句选择算法将文本的主题数与所抽取的主题句的数量关联在一起,保证每一个主要的主题都有对应的主题句被选中,并解决主题句的去重问题,从而进一步提高所抽出主题句的主题覆盖性和概括性.

关 键 词:主题句  主题抽取  文本压缩
文章编号:1006-2467(2006)05-0771-04
收稿时间:2005-06-04
修稿时间:2005-06-04

A Synthesized Method of Extracting Subject Sentences from Text
ZHANG Yun-tao,GONG Ling,WANG Yong-cheng.A Synthesized Method of Extracting Subject Sentences from Text[J].Journal of Shanghai Jiaotong University,2006,40(5):771-774,782.
Authors:ZHANG Yun-tao  GONG Ling  WANG Yong-cheng
Abstract:
Keywords:subject sentence  subject extraction  text compressing
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号