首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
Engineering and research teams often develop new products and technologies by referring to inventions described in patent databases. Efficient patent analysis builds R&D knowledge, reduces new product development time, increases market success, and reduces potential patent infringement. Thus, it is beneficial to automatically and systematically extract information from patent documents in order to improve knowledge sharing and collaboration among R&D team members. In this research, patents are summarized using a combined ontology based and TF-IDF concept clustering approach. The ontology captures the general knowledge and core meaning of patents in a given domain. Then, the proposed methodology extracts, clusters, and integrates the content of a patent to derive a summary and a cluster tree diagram of key terms. Patents from the International Patent Classification (IPC) codes B25C, B25D, B25F (categories for power hand tools) and B24B, C09G and H011 (categories for chemical mechanical polishing) are used as case studies to evaluate the compression ratio, retention ratio, and classification accuracy of the summarization results. The evaluation uses statistics to represent the summary generation and its compression ratio, the ontology based keyword extraction retention ratio, and the summary classification accuracy. The results show that the ontology based approach yields about the same compression ratio as previous non-ontology based research but yields on average an 11% improvement for the retention ratio and a 14% improvement for classification accuracy.  相似文献   

2.
Engineering and research teams often develop new products and technologies by referring to inventions described in patent databases. Efficient patent analysis builds R&D knowledge, reduces new product development time, increases market success, and reduces potential patent infringement. Thus, it is beneficial to automatically and systematically extract information from patent documents in order to improve knowledge sharing and collaboration among R&D team members. In this research, patents are summarized using a combined ontology based and TF-IDF concept clustering approach. The ontology captures the general knowledge and core meaning of patents in a given domain. Then, the proposed methodology extracts, clusters, and integrates the content of a patent to derive a summary and a cluster tree diagram of key terms. Patents from the International Patent Classification (IPC) codes B25C, B25D, B25F (categories for power hand tools) and B24B, C09G and H011 (categories for chemical mechanical polishing) are used as case studies to evaluate the compression ratio, retention ratio, and classification accuracy of the summarization results. The evaluation uses statistics to represent the summary generation and its compression ratio, the ontology based keyword extraction retention ratio, and the summary classification accuracy. The results show that the ontology based approach yields about the same compression ratio as previous non-ontology based research but yields on average an 11% improvement for the retention ratio and a 14% improvement for classification accuracy.  相似文献   

3.
汽车产业是专利密集型产业的典型代表,专利布局优化受专利布局动机、策略、目的等多因素影响,为克服以往专利布局中人工选择专利的主观性、专利价值难量化性以及专利组合问题处理的复杂性等,本研究从战略价值、经济价值和成本三个方面对专利进行综合度量,提出了复合价值导向的专利计算方法,构建了基于汽车技术主题组合效应的专利布局多目标优化模型.计算结果表明,基于该模型利用算法优化后得到的汽车专利布局总体价值优于原方案与人工选择优化方案,具有复合价值导向的汽车专利布局更能充分评估和配置汽车企业专利,提升专利价值,可有效促进我国汽车企业科学优化专利布局,提高专利利用率和技术转化效率.  相似文献   

4.
在技术供需文本匹配视角下,提出了一种基于语义相似聚类的技术需求识别模型.首先,采集网络中技术需求文本提取关键短语;然后,建立领域专利技术转让索引库,基于需求关键短语检索出高相关专利,构建专利技术供给背景库,并对背景库中专利标题与摘要进行分词;第三,提出基于词向量的供需文本语义匹配度算法,筛选有效技术需求并进行语义相似聚类;最后,考虑技术需求对应的需求量和专利技术转让量,对聚类结果进行二维分类.以新能源领域为例进行实证,识别出有效技术需求195个,基于语义相似聚成12类,结合需求量与专利转让量,将12类技术需求分为“高需求、高转让”、“高需求、低转让”、“低需求、高转让”、“低需求、低转让”四大类.该研究为网络技术需求挖掘及供需匹配提供一种新思路.  相似文献   

5.
球型模糊c均值算法在中文文本聚类中的应用   总被引:3,自引:1,他引:2  
一般的聚类算法只能将给定的文本归到一个类,但实际的文本往往属于多个类。提出一种基于球形的模糊c-均值算法的中文文本聚类方法。聚类方法仅考虑文本向量的方向而不考虑文本向量的大小。同时,聚类方法能充分考虑文本隶属于类的程度,并能通过用户给定的阈值将给定的文本归到多个类。实验表明,球形的模糊c-均值算法不仅具有好的聚类精度,而且能找出属于多个类的文本。  相似文献   

6.
基于专利的技术发展趋势评价系统   总被引:1,自引:0,他引:1  
技术发展趋势的研究能够帮助政府、企业合理地制订研发战略,对经济社会产生广泛而深远的积极作用。在总结并改进现行的专利时间序列、专利引用以及专利IPC分类分析方法基础上,从技术的生命周期、技术研究热点和技术机会方面,提出了基于专利分析的技术发展趋势评价系统,并以第三代移动通信技术领域作为研究对象进行了实证分析。实证分析表明,该评价系统具有较好的科学性与实用性。  相似文献   

7.
本文首先对三维空间中面板数据的曲面几何特征进行了描述,并从"绝对数量"、"增长速度"、"几何相似性"和"空间绝对距离"等几个方面对曲面相似性指标进行了定义和构建,对模糊C均值聚类方法进行了优化.在此基础上,对2000-2010年中国31个省市专利产出活动的类型特征及其地域分异规律进行了探索.实证研究结果表明聚类效果良好,中国专利产出无论数量、绩效还是增速在总体上均呈上升趋势并存在空间异质性和自相关性.创新能力较强的省区虽集中在东部,但正在向中西部地区扩散.同时,创新总体上仍主要来自于政府推动尤其是研发资金投入,并且研发资源投入总量以及研发人员可支配资金的区域配置极不均衡.此外,财政拨款对于东、西部地区创新效率的作用也存在很大差异.因此,政府可根据区域研发能力和资源现状的不同,制定合理的区域科技发展战略与相关政策工具,从而挖掘区域创新动力,提升区域专利创新能力.  相似文献   

8.
针对目前欠定盲分离问题中源数未知,采取"两步法"进行分离源信号.在第一步聚类算法中,一般都假设源信号个数已知,即事先给定聚类数目,这类算法成功与否依赖于源信号个数的先验知识.为了有效解决这个问题,提出了一种新的基于模糊聚类分析的无监督学习算法,它利用观测信号之间的相似关系来确定模糊相似矩阵进行迭代算法,不但可以精确估计源信号个数,同时也能获得对混叠矩阵的精确估计.该方法进一步完善了"两步法",仿真结果表明了算法的有效性及优异性能.  相似文献   

9.
新话题发现是进行舆情分析的基础和前提,新话题发现的一个关键环节是进行关键词的聚类分析.目前,大量的新话题来源于微博,但是将传统的聚类算法用于微 博新话题发现时,会产生特征向量的高维性和稀疏性问题,使得聚类结果非常不准确,而且收敛时间难以控制,进而影响舆情分析的可靠性和实时性.鉴此,本文提 出了频繁词集聚类FWSC (frequent words sets clustering)方法.实验结果表明,我们提出的方法能够快速有效地发现新话题.  相似文献   

10.
为了提高海量XML文档集的聚类质量,提出了一种基于向量空间模型的矩阵迭代自组织XML辅助聚类算法。该算法以XML键为基础,把XML文档转化为向量矩阵,通过矩阵迭代自组织学习对XML文档实施取消、分裂与合并等优化措施。为了加速算法的收敛性,在算法中引入辅助策略,虽然不一定达到矩阵向量分类间隔最大化的目标,却在尽可能分类的情况下使得运算时间缩短,其XML键权重调整更有利聚类效果。对比其它向量聚类算法,一系列仿真实验表明所提出算法具有一定的有效性及合理性。  相似文献   

11.
一种改进的人工免疫文本聚类算法   总被引:1,自引:0,他引:1  
构造了一种能准确描述文本之间相似性(亲和力)的新方法,并在此基础上提出了一种改进的人工免疫文本聚类算法。仿真结果表明,与传统的文本聚类算法相比,新算法不仅能自动发现新类,而且具有聚类精度更高、数据压缩比更大、与输入初始配置无关、可增量处理的优势。  相似文献   

12.
知识密集型制造业专利创新运营绩效研究   总被引:1,自引:0,他引:1  
利用SFA模型进行分解修正样本投入的偏移量,在此基础上引入Malmquist指数改进,结合Tobit技术,综合考虑环境因素、随机误差与动态变化,将时空异质性和影响因素引入专利创新的运营绩效模型进行动态分析,从方法和内容上深入探究知识密集型制造业专利创新运营绩效异质性和影响机制.结果表明,考虑处理环境效应和随机误差的专利创新运营绩效出现显著变化,环境因素对专利创新运营绩效影响存在时空异质性;调整后2007-2013年专利创新运营绩效呈现双重升降的波动趋势,各时期差异明显;调整后各地区专利创新运营绩效增长幅度较大,其中技术水平指数均发生不同程度改善,是调整后专利创新运营绩效提升的主要动力;政府支持对知识密集型制造业专利创新运营绩效具有显著的正向影响,而知识产权保护产生显著抑制效应,市场竞争、企业规模和技术消化吸收能力对专利创新运营绩效的推动作用不明显.  相似文献   

13.
认知跳频被认为是消除传统跳频系统用频困扰的有效途径之一。针对认知跳频超宽带和多频隙实时频谱感知的需求,给出基于归一化谱双向搜索(bidirectional search of normalized power spectrum, BSNP)的感知算法,BSNP以跳频频隙内的归一化功率谱作为检验统计量,通过顺序执行正向和反向搜索,感知出跳频带宽中已被占用的所有频隙。利用傅里叶变换的渐进正态性和相互独立性,可推导BSNP单次判决虚警概率的数学表达式和判决门限的闭式表达式。分析和仿真表明,BSNP可以准确地找出频带内被占用的频隙,相比于常规谱估计感知算法,可有效克服噪声不确定度对频谱感知性能的 影响。  相似文献   

14.
提出了一种基于模式识别技术的彩色图像量化的新算法—基于最小距离最大的快速统计聚类算法(FSCAMMD)。本算法克服了SCA算法对聚类中心初始值选取的不足,给出了最大频度与类内最小距离最大相结合的方法—初始值优选法。实验结果表明,本算法可较大幅度地减少图像量化后的总方差以及颜色失真度,量化效果优于SCA和其它一些聚类量化算法。  相似文献   

15.
随着网络与信息技术的快速发展,导致网络上产生了大量的电子文本,而文本间的相似度计算是文本处理的一种重要手段。对于大规模的文本集,通常采用向量空间模型(vector space model, VSM)进行文本表示,但是该方法面临着文本向量维度较高及文本语义相似度难以度量的问题。提出一种改进的文本相似度计算方法,从大量的特征空间中选择出具有代表性的元数据特征向量元素,以降低向量空间的维度;构建领域概念树并设计基于领域概念树的文本相似度算法,对领域概念中广泛存在的同义词进行处理,以提高文本之间语义相似度度量的性能。实验结果表明:通过降维和概念相似度计算可提高文本相似度计算的性能。  相似文献   

16.
资源的有限性以及活动的并发执行导致协同任务中极易发生资源冲突,需施加时间约束以限定活动执行时间从而避免冲突的出现。在分析多机协同任务的基础上,将任务过程转化为带有多容量资源的任务调度模型,根据模型时间特性给出资源冲突定义及其判断准则。提出基于最小冲突集的资源冲突检测算法,其中利用时间交叠关系的特点,将资源冲突的检测与消解问题转化为连通图中闭团的检查与消除问题。进而从约束满足的角度研究了基于最小承诺策略的消解算法。实验结果表明方法的有效性。  相似文献   

17.
基于主元分析和免疫聚类的双向特征数据压缩方法   总被引:4,自引:0,他引:4  
针对诊断特征数据中的重复或相似事例样本和特征参量之间可能存在的相关性,提出并实现了一种有效的特征数据双向压缩预处理方法,从而在不损失数据隐含的特征知识的前提下,有效降低学习机器的学习负担。在进行样本参量的降维处理时,采用基于主元分析的横向数据压缩方法,有效地去除了各特征参量之间的相关性。在压缩样本数量时,综述和比较了现有的各种聚类算法,基于竞争和自组织原理,对借鉴生物体的自然免疫系统中克隆选择以及免疫网络自稳定等有关机理的常规免疫聚类压缩算法,作了重要改进,提出了基于主元核相似度的亲和力定义方法,增加了抗原数据归一化、近似样本直接去除等处理步骤,使算法具有更高的执行效率和更广的适应性。并以国际上通用的过程控制仿真对象“Tennessee Bastman”工厂的实际数据进行仿真实验,验证了所提方法的有效性。  相似文献   

18.
1. INTRODUCTIONClustering analysis is one of the major techniques in knowledge discovery in database (KDD),and other fields such as pattern recognition [1, 91. It is an approach to divide a data set illtosome categorically homogenous subsets called "clusters". The K-means algorithm [1] is a wellknown algorithm for this problem. It is a typical iterative hill-climbing algorithm, and thesolution obtained depends on the initial clustering. Although the K-means algorithm has beenapplied to …  相似文献   

19.
基于中国30个省份2004~2015年的面板数据,利用EOF法探究了中国绿色专利产出的时空分异特征,实证考察了中国FDI、OFDI对绿色专利产出的知识产权保护门槛效应,并进一步分析了不同地区知识产权保护的时空异质性。研究结果表明:样本期间中国绿色专利产出时空分异特征明显,第一模态结果表明,东北和东南沿海地区为高值区,西北地区为低值区;第二模态结果表明,京津冀地区、东北地区和东南沿海地区绿色专利产出增长速度较快,西北地区增长速度较慢;中国FDI、OFDI与绿色专利产出之间分别存在显著的知识产权保护三重和双重门槛,随着知识产权保护水平提升,FDI对绿色专利产出的影响系数由正转负且持续下降,OFDI对绿色专利产出的影响系数由负转正,且持续上升,两者均存在明显的门槛特征;中国双向FDI驱动绿色创新存在地区知识产权保护水平的时空异质性,大多数地区呈从低知识产权保护强度向中高知识产权保护强度跨越的态势。  相似文献   

20.
客户关系管理中客户知识发现的一种分析方法   总被引:2,自引:0,他引:2  
研究了客户关系管理(CRM)中的客户知识发现问题。在分析了客户知识发现的含义和客户知识分类的基础上,提出了一种客户知识发现的分析方法。依据该方法,通过采用模糊聚类方法可确定影响CRM效果的关键属性集,进而可归纳发现客户知识的分类规则,并得到有价值的客户知识。最后给出了一个实例分析。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号