首页 | 本学科首页   官方微博 | 高级检索  
     

基于领域本体的文档自动摘要算法
引用本文:王麒,江开忠,杨静,顾君忠. 基于领域本体的文档自动摘要算法[J]. 华东师范大学学报(自然科学版), 2007, 2007(5): 107-112
作者姓名:王麒  江开忠  杨静  顾君忠
作者单位:华东师范大学,计算机应用研究所,上海,200062;华东师范大学,计算机应用研究所,上海,200062;华东师范大学,计算机应用研究所,上海,200062;华东师范大学,计算机应用研究所,上海,200062
摘    要:
介绍了一种以潜语义分析模型为基础,辅之以领域本体的文档自动摘要算法.该方法在传统的基于统计的奇异值分解算法基础上,通过领域本体引入了文档主题识别以及概念相似度计算,更好地用形式化的方式描述了文档的主要内容;在文档主题和概念相似度的指导下,使用统计方法和启发式规则抽取文档中的关键句子作为摘要,并通过实验证明提高了摘要的质量.

关 键 词:本体  自动摘要  奇异值分解
文章编号:1000-5641(2007)05-0107-06
收稿时间:2006-12-15
修稿时间:2006-12-01

Domain Ontology-Based Document Automatic Summarization
WANG Qi,JIANG Kai-zhong,YANG Jing,GU Jun-zhong. Domain Ontology-Based Document Automatic Summarization[J]. Journal of East China Normal University(Natural Science), 2007, 2007(5): 107-112
Authors:WANG Qi  JIANG Kai-zhong  YANG Jing  GU Jun-zhong
Affiliation:Institute of Computer Applications, East China Normal University, Shanghai 200062, China
Abstract:
A new arithmetic based on Latent Semantic Analysis Model and domain ontology was proposed to summarize the document. Based on the traditional statistic arithmetic,recognition of document theme and computation of concept similarity were imposed by using domain ontology, which described the main content of documents better. In the guide of document theme and concept similarity, statistical approaches and heuristic rules to extract key-sentences were used, which are proved to improve the quality of automatic summarization arithmetic by experiment.
Keywords:ontology   automatic summarization   singular value decomposition
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《华东师范大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《华东师范大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号