首页 | 本学科首页   官方微博 | 高级检索  
     

基于SAO-Onto知识模型的中文专利语义搜索与评估方法
作者姓名:滕昊  王楠  赵宏宇  王亚可  曹政
作者单位:1. 北京信息科技大学计算机学院;2. 北京信息科技大学网络文化与数字传播北京市重点实验室;3. 腾讯科技(北京)有限公司
基金项目:国家自然科学基金(61671070);;北京市自然科学基金(4212020);
摘    要:文章提出了一种面向中文专利语义搜索的新方案。通过对涉及审查、无效、侵权等专利对比文件的挖掘,构建了用于语义搜索评估的匹配数据集和排序数据集。从SAO(Subject-Action-Object)三元组知识抽取出发,融合百科知识和HowNet语言知识库,设计开发了SAO知识模型(SAO-Onto)来辅助SAO各元素的语义扩展。综合考虑相似阈值、权重计算、召回排序等策略进一步改进了语义匹配方案。研究结果表明,本文所提出方案在专利召回和排序两个环节中均取得了较好的效果,可以有效提升中文专利语义搜索能力,为后续的工业级应用奠定了基础。

关 键 词:专利  SAO-Onto  语义搜索  HowNet
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号