首页 | 本学科首页   官方微博 | 高级检索  
     

基于本体的文档语义标注改进方法
引用本文:陈叶旺,李文,彭鑫,赵文耘. 基于本体的文档语义标注改进方法[J]. 东南大学学报(自然科学版), 2009, 39(6). DOI: 10.3969/j.issn.1001-0505.2009.06.005
作者姓名:陈叶旺  李文  彭鑫  赵文耘
作者单位:复旦大学计算机科学技术学院,上海,200433
基金项目:国家高技术研究发展计划(863计划)资助项目 
摘    要:在领域本体知识的语义环境和资源文档结构基础上,提出一种文档语义标注改进方法,分析、计算标签一文档的词频相关性和语义环境在局部窗口的共现性,实现对各类文档资源的语义标注.该方法首先提取出文档资源的纯文本内容,并分解出子句、句和段落集合.然后,对于每个具体的领域知识项,在本体知识库中寻找其语义环境信息.最后,按照7条相关度规则,分别计算出这些信息与分解后文档内容的相关度,从而完成整个文档库内和知识库内的综合计算,得到该项知识与文档资源的最终相关度.卖验结果显示,该方法能够依据领域本体,有效地对互联网中大量以网页等形式存在的多种类文档知识资源进行自动语义标注.

关 键 词:本体  语义环境  语义标注

Improved semantic annotation method for documents based on ontology
Chen Yewang Li Wen Peng Xin Zhao Wenyun. Improved semantic annotation method for documents based on ontology[J]. Journal of Southeast University(Natural Science Edition), 2009, 39(6). DOI: 10.3969/j.issn.1001-0505.2009.06.005
Authors:Chen Yewang Li Wen Peng Xin Zhao Wenyun
Affiliation:Chen Yewang Li Wen Peng Xin Zhao Wenyun(School of Computer Science,Fudan University,Shanghai 200433,China)
Abstract:Based on the semantic context and the structural info of a document,an improved semantic annotation method is proposed.The correlation between the ontology entity and the document and the co-appearance of the label-words frequents and the semantic context in local window are analysed and calculated.Firstly,this method extracts the text content from the document,and then decomposes it into a sub-sentences set,a sentences set and a paragraphs set.For each knowledge item in ontology,the context information of ...
Keywords:ontology  semantic context  semantic annotation
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号