首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向中文专利SAO结构抽取的文本特征比较研究
引用本文:饶齐,王裴岩,张桂平.面向中文专利SAO结构抽取的文本特征比较研究[J].北京大学学报(自然科学版),2015,51(2):349-356.
作者姓名:饶齐  王裴岩  张桂平
作者单位:沈阳航空航天大学知识工程研究中心, 沈阳 110136;
基金项目:国家“十二五”科技支撑计划项目(2012BAH14F00)资助
摘    要:针对中文专利文本中SAO结构实体关系抽取问题, 使用支持向量机的机器学习方法进行关系抽取实验, 分别对基本词法信息、实体间距离信息、最短路径闭包树句法信息以及词向量信息等特征的有效性进行验证分析。实验结果表明, 基本的词法信息能够明显提高关系抽取性能, 而句法信息没有显著提高关系抽取效果。此外, 也验证了词向量在SAO结构关系抽取中的可行性。

关 键 词:SAO结构  关系抽取  特征有效性  词向量  
收稿时间:2014-07-27

Text Feature Analysis on SAO Structure Extraction from Chinese Patent Literatures
RAO Qi , WANG Peiyan , ZHANG Guiping.Text Feature Analysis on SAO Structure Extraction from Chinese Patent Literatures[J].Acta Scientiarum Naturalium Universitatis Pekinensis,2015,51(2):349-356.
Authors:RAO Qi  WANG Peiyan  ZHANG Guiping
Institution:Knowledge Engineering Research Center, Shenyang Aerospace University, Shenyang 110136;
Abstract:In order to resolve the problem of SAO-based relation extraction from Chinese patent literatures, a series of experiments were implemented by using Support Vector Machines. It focused on the analysis of the validity of basic lexical information, syntactic information such as the shortest path enclosed tree, and distance features used in related works. The results show that simple lexical features can contribute to a good performance, while syntactic features cannot bring a remarkable improvement. Moreover, the feasibility of a new representation of words, word embeddings, is validated on SAO-based relation extraction.
Keywords:SAO structure  relation extraction  effectiveness of features  word distributed representation
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《北京大学学报(自然科学版)》浏览原始摘要信息
点击此处可从《北京大学学报(自然科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号