首页 | 本学科首页   官方微博 | 高级检索  
     

面向非受限领域的综合式自动中文文摘方法
引用本文:郭玉箐,万敏,罗振声. 面向非受限领域的综合式自动中文文摘方法[J]. 清华大学学报(自然科学版), 2002, 42(1): 139-142
作者姓名:郭玉箐  万敏  罗振声
作者单位:清华大学中国语言文学系,北京 100084
基金项目:国家自然科学基金资助项目 ( 6 9972 0 2 5 )
摘    要:讨论了一种面向非受限领域的综合式中文自动文摘方法。其基本思路是 :采用向量空间模型对篇章结构进行自动分析 ,建立基于语义相似度的段落关系图 ,获取段落的重要度信息 ,并使用标题或聚类的方法划分意义段 ;根据词的频度 ,句子位置、提示语等文本形式特征计算句子的权值 ,分别从各意义段中选取高权值的句子作为文摘句 ;对文摘句进行句法和语义分析 ,消除冗余 ,解决指代词悬挂、文摘不连贯等问题 ,最终组成一篇简洁、通顺、可读性好的文摘

关 键 词:自动文摘方法  向量空间模型  文本形式特征  可读性
文章编号:1000-0054(2002)01-0139-04
修稿时间:2000-10-12

Automatic abstracting in domain independent Chinese documents
GUO Yuqing,WAN Min,LUO Zhensheng. Automatic abstracting in domain independent Chinese documents[J]. Journal of Tsinghua University(Science and Technology), 2002, 42(1): 139-142
Authors:GUO Yuqing  WAN Min  LUO Zhensheng
Abstract:
Keywords:automatic abstracting  vector space model  text surface feature  readability process  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号