专利技术功效短语获取研究 |
| |
作者姓名: | 胡菊香 吕学强 刘秀磊 刘克会 |
| |
作者单位: | 北京信息科技大学网络文化与数字传播北京市重点实验室,北京信息科技大学网络文化与数字传播北京市重点实验室,北京信息科技大学,北京市新技术应用研究所;北京市新技术应用研究所 |
| |
基金项目: | 本课题受国家自然科学(61271304)资助;北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)资助;北京市属高等学校创新团队建设与教师职业发展计划项目(IDHT20130519)资助;北京市科研院创新工程项目(PXM2013_178215_000002)。 |
| |
摘 要: | 在专利技术功效矩阵构建研究中,专利技术功效短语获取是矩阵构建的基础,也是构建矩阵的词汇来源。专利技术功效短语获取的准确性直接影响专利技术功效矩阵构建的效果。为了提高专利技术功效短语的准确性,基于汽车新能源专利文献文本数据基础上,综合考虑专利文献结构、专利文献线索词,以及专利文献的句法、语法分析等多种因素,提出了基于规则和统计相结合的专利技术功效短语获取方法。首先,根据专利摘要文本定位包含专利技术功效短语的单句,提取技术功效目标句;其次,在改进的分词方法和词性标注的基础上,针对包含功效短语的句子,结合依存关系规则、短语规则计算出共现频率较高的词,并提取技术功效短语。利用该方法获取专利技术功效短语,其准确率可到达85%。实验证明该方法在获取专利技术功效短语中是有效的、可行的,进而整体上提高专利技术功效短语的识别效果。
|
关 键 词: | 规则 依存关系 短语规则 技术功效短语 |
收稿时间: | 2015-12-17 |
修稿时间: | 2016-01-25 |
本文献已被 CNKI 等数据库收录! |
| 点击此处可从《科学技术与工程》浏览原始摘要信息 |
|
点击此处可从《科学技术与工程》下载免费的PDF全文 |
|