首页 | 本学科首页   官方微博 | 高级检索  
     

中文新闻关键事件的主题句识别
引用本文:王伟,赵东岩,赵伟. 中文新闻关键事件的主题句识别[J]. 北京大学学报(自然科学版), 2011, 47(5): 789-796
作者姓名:王伟  赵东岩  赵伟
作者单位:1. 北京大学计算科学与技术研究所, 北京 100871; 2. 计算语言学教育部重点实验室, 北京 100871; 3. 武警工程学院电子技术系, 西安 710086;
基金项目:国家自然科学基金(61003009); 北京市科委基金(Z101101005010003); 高等学校博士学科点专项科研基金(20100001120029)资助
摘    要:提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点, 分析了新闻报道与事件的关系, 以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新闻标题按信息含量进行分类, 然后结合新闻句子的词频、长度、位置、与标题的相似度等特征计算句子的重要性。实验表明, 该方法能够准确提取新闻主题句, 为进一步抽取事件信息打好了基础。

关 键 词:计算机应用  中文信息处理  自然语言处理  自动文摘  事件抽取  新闻标题  
收稿时间:2010-09-10

Identification of Topic Sentence about Key Event in Chinese News
WANG Wei,ZHAO Dongyan,ZHAO Wei. Identification of Topic Sentence about Key Event in Chinese News[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2011, 47(5): 789-796
Authors:WANG Wei  ZHAO Dongyan  ZHAO Wei
Affiliation:1. Institute of Computer Science and Technology, Peking University, Beijing 100871; 2. Key Laboratory of Computational LinguisticsMOE, Peking University, Beijing 100871; 3. Department of Electronic Technology, Engineering College of Armed Police Force, Xi’an 710086;
Abstract:The authors propose an approach to extract topic sentences that describe key event from a news article.Considering the special structure of news articles,the relations between news articles and key events reported in them is studied,as well as the characteristics of a news headline in three aspects: information,form and language.A novel method based on the information aspect of a headline is used to extract a topic sentence which contains the key event information from a news story.The method first classifi...
Keywords:computer application  Chinese information processing  natural language processing  automatic text abstract  event extraction  news headline  
本文献已被 CNKI 等数据库收录!
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号