首页 | 本学科首页   官方微博 | 高级检索  
     

受限领域的自动文摘方法研究
引用本文:耿增民,刘万春,朱玉文. 受限领域的自动文摘方法研究[J]. 北京理工大学学报, 2006, 26(8): 712-715
作者姓名:耿增民  刘万春  朱玉文
作者单位:北京理工大学,计算机科学技术学院,北京,100081;中国原子能科学研究院,计量测试研究所,北京,102413;北京理工大学,计算机科学技术学院,北京,100081
摘    要:为解决受限领域统计型文摘对文档中心内容理解不足的缺陷,研究了结合领域知识生成单文档文摘的方法;论述了构建受限领域的语料库和知识库的方法;提出对粗文摘进行文摘句概化和在其中加入领域知识的文摘后处理方法. 在所提出理论基础上开发了文摘系统软件. 通过和MS Word 2003中的文摘工具进行实验对比,表明提出的方法切实可行,可以推广到其它领域.

关 键 词:自动文本摘要  知识库  语料库  文摘框架  文摘后处理
文章编号:1001-0645(2006)08-0712-04
收稿时间:2006-01-20
修稿时间:2006-01-20

Study on Domain-Dependent Automatic Text Summarization
GENG Zeng-min,LIU Wan-chun and ZHU Yu-wen. Study on Domain-Dependent Automatic Text Summarization[J]. Journal of Beijing Institute of Technology(Natural Science Edition), 2006, 26(8): 712-715
Authors:GENG Zeng-min  LIU Wan-chun  ZHU Yu-wen
Affiliation:1. School of Computer Science and Technology, Beijing Institute of Technology, Beijing 100081, China; 2.Department of Metrology Research, Chinese Institute of Atomic Energy, Beijing 102413, China
Abstract:Studies ways of generating text summary by utilizing domain knowledge to dissolve the limitation that statistical summary is defective in understanding document meanings.Discusses methods in constructing the corpus and knowledge base;proposes methods to postprocess the summary by generalizing summary sentences and adding knowledge to the summary.Developes text summarizing software based on the theory presented.In comparing it with MS Word 2003,it is seen that the approaches are effective and efficient;and can be extended to other domains.
Keywords:automatic text summarization  domain knowledge base  corpus  summary frame  post-processing of summary
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《北京理工大学学报》浏览原始摘要信息
点击此处可从《北京理工大学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号