首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
针对分布式建立与存储的领域本体主题图在融合过程中的语义与结构重复问题以及冗余信息的判断与消除问题,提出了基于语义词典与语料库相结合的主题图融合算法(TMMC),给出了概念相似度计算以及同义关系、整体部分关系等的处理方法.对本体中概念进行基于HowNet语义词典及其他语义词典的多层次相似度计算,定义概念间不同语义关系的融合规则,针对专业领域本体中大量术语词典未收录的问题,提出基于语料库的概念相似度算法,并对计算机教育专业领域扩展主题图进行了融合实验.实验结果表明,TMMC提高了融合的准确率与查全率.  相似文献   

2.
针对基于元数据或传统主题图的知识组织模式没有实现知识的多层次多粒度表示,以及知识融合过程中相似性算法准确性不高而影响融合质量的问题,结合全信息理论与扩展主题图结构特点及语义信息,提出了面向多源知识融合的扩展主题图相似性算法(ETMSC)和阈值选取的相关性、层次对应和实验确定三原则.该算法综合了语法、语义和语用的相似性,扩展了主题图元素间组成结构上的相似性,同时充分考虑了涵义及所处语境的相似性.主题图相似性的判别准则与阈值有关,阈值的确定与数据集相关.实验结果表明,ETMSC算法与单纯基于语法或语义的相似性算法相比,准确性提高了9.2%~11.1%.  相似文献   

3.
针对空间分布的全局外观潜在变化的行人再识别问题,提出一种基于空间约束和二次相似度学习算法.通过二次相似度函数(QSF)估计每个子区域的相似度,从而形成多项式特征图,并将所有特征图融合到统一的框架中.该框架利用局部相似度和全局相似度的互补优势,结合多个视觉线索进一步提高算法的鲁棒性.实验对比3个公共数据集,结果表明:基于空间约束和二次相似度学习算法具有显著的识别性能.  相似文献   

4.
提出了利用主题词存在与否的基于主题词的短语抽取算法,并在其基础上利用社会知识词簇集合作为分类信息,词的相似度作为距离权重,利用改进K最近邻分类算法(KNN)的分类思想,提出基于《知网》词相似度的短语主题抽取算法.并在其基础上提出一种根据中文表达习惯的基于加权主题词的短语主题抽取算法.实验结果表明,后两种算法对短语主题抽取效果良好,平均查全率分别达到78.88%和83.39%,平均查准率达99.06%和99.70%.  相似文献   

5.
首次提出了一种基于换位不变交叉相似度矩阵和改进稀疏交叉递推图的短相似片段检测算法.为了构造相似度矩阵,采用了能够抵抗单帧噪声和不准确度的中心加权扩展特征.然后结合全局稀疏阈值策略和局部稀疏阈值策略的优点,建立了一个混合稀疏交叉递推图,以获得更精确的相似片段位置.实验结果证实了该方法的有效性,特别是对于较短的相似片段.  相似文献   

6.
随着信息科学技术的发展和互联网技术的普及,社会上出现了越来越多的以博取观众的眼球为目的的“标题党”现象。为了识别“标题党”新闻,给出了一种基于改进型的VSM 结合余弦相似度的文本相似度计算方法和《知网》( HowNet) 文本相似度计算方法,并研究了基于改进型VSM-HowNet 融合相似度算法,用这些文本相似度的计算方法分别和已有研究中的王氏主题-词形文本相似度计算方法做对比。此方法对“标题党”新闻识别的总准确率、总召回率及总F1值均高于其他文本相似度计算方法,对于识别一篇未知类型的新闻,改进型VSM-HowNet 融合相似度算法相比于其他文本相似度计算方法更有优势。  相似文献   

7.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一。鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1,…,Kwk-Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法。这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足。
  相似文献   

8.
基于LDA的文本聚类在网络舆情分析中的应用研究   总被引:1,自引:0,他引:1  
针对传统的基于词语的文本聚类算法忽略了文本中可能具有的隐含信息的问题,提出了一种基于LDA(latent dirichlet allocation)主题模型的文本聚类算法。该方法利用TF-IDF算法和LDA主题模型分别计算文本的相似度,通过耗费函数确定文本相似度的融合系数并进行线性结合来获取文本之间的相似度,同时使用F-measure值来对聚类结果进行评估。在构建LDA主题模型时,采用Gibbs抽样来进行参数估计,通过贝叶斯统计的标准方法进行最优主题数的确定。从仿真实验的聚类结果的准确性和稳定性来看,该方法相比传统的文本聚类算法具有更良好的效果。  相似文献   

9.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一。鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1,…,Kwk*Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法。这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足。  相似文献   

10.
提出了一种面向翻唱歌曲识别的相似度融合算法。该算法将基于乐理特征的相似度和基于人耳感知特性的相似度融合,通过把基于节拍跟踪和瞬时频率音级轮廓(IF-PCP)的最大互相关相似度、基于和声音级轮廓(HPCP)的Qmax相似度、基于耳蜗音级轮廓(CPCP)的Q_(max)相似度映射到同一个多维空间,并计算其几何距离来进行相似度融合。该算法使得IF-PCP特征的节拍速度不变性、HPCP特征的和声优势、CPCP特征的人耳感知特性有效融合。为了验证算法的有效性,采用包含212首不同歌曲共502个版本的数据库作为测试对象,以平均正确率均值和TOP-N作为测试指标对算法性能进行测试。测试结果表明,与基于单一相似度算法相比,该融合算法可提高翻唱歌曲识别准确率。  相似文献   

11.
学科知识的线性组织结构以及知识导图类的目录状、网络状平面呈现,将认知的结构信息与知识细节信息同时呈现,在一定程度上加大了认知的负担,同时,无法对知识及其相关性进行定位,知识间的拓扑关系无法较好表达.针对上述问题,该文从认知过程出发,分析了学科知识结构认知过程与地理空间认知过程的层次相似性,并依此建立学科知识结构的地理空间化方法,将传统的线性知识组织及线性空间,转化为二维平面化知识组织与二维平面空间,探讨一种新的利用地图空间化的层次认知,形象、直观、快速提高传统课程知识结构认知的方法,为知识导航与智能导学建立地理化的位置服务基准,有效地扩展了知识地图的应用.  相似文献   

12.
基于Web知识本体的Topic Maps研究   总被引:1,自引:0,他引:1  
针对复杂产品设计行业信息系统应用集成中存在的Web知识的检索、共享、集成和重用问题,研究了复杂产品设计行业中异构设计本体和异构应用本体的抽象特征,提出了一种基于知识本体与Web服务的主题图(Topic Maps)概念,构建了复杂产品设计行业知识本体的主题图,以复杂产品设计中的若干知识为例说明用主题图构建复杂产品知识本体库的方法.利用主题图对复杂产品设计领域的知识进行知识类型描述、信息抽取与表示,建立了复杂产品设计的本体库,实现了对知识的快速高效检索和对异构、分散知识的共享和重用.  相似文献   

13.
主题地图标准及其应用研究   总被引:3,自引:0,他引:3  
主题地图是描述知识结构、知识与信息资源之间联系的元数据标准。为了实现更有效的信息查找和知识管理,本文介绍了主题地图元数据模型,详述了主题地图的核心概念,探讨了主题地图的主要应用,概述了其软件开发的关键技术,并给出应用实现模型和一个具体应用的实现。  相似文献   

14.
基于FIFA的主题相似性计算模型   总被引:2,自引:0,他引:2  
针对主题检测和追踪的第五个技术任务连接分析,提出了一种事件主题相似性分析技术·通过引入领域知识库,将基于词汇的分析技术提升到领域知识计算层面·当输入不同两个文档时,采用该分析技术进行识别文档内容所涉及到的事件主题是否一致·首先采用FIFA模型进行内容主题识别,然后采用LDM模型进行事件主题相似性计算分析·实验结果显示主题相似性计算正确率为64%,召回率为69%·  相似文献   

15.
The procedure of hypertext induced topic search based on a semantic relation model is analyzed, and the reason for the topic drift of HITS algorithm was found to prove that Web pages are projected to a wrong latent semantic basis. A new concept-generalized similarity is introduced and, based on this, a new topic distillation algorithm GSTDA(generalized similarity based topic distillation algorithm) was presented to improve the quality of topic distillation. GSTDA was applied not only to avoid the topic drift, but also to explore relative topics to user query. The experimental results on 10 queries show that GSTDA reduces topic drift rate by 10% to 58% compared to that of HITS(hypertext induced topic search) algorithm, and discovers several relative topics to queries that have multiple meanings.  相似文献   

16.
客户的个性化需求使产品设计知识越来越丰富,为管理虚拟产品装配设计知识,以知识融合为理论基础,提出了知识管理系统总体结构.采用面向对象的XML知识表示方法,通过获得用户需求和工程规则,建立知识库.对知识进行规范化处理,通过设计任务分解,进行知识推理,建立虚拟装配知识模型.最终以垃圾车装填装置为例,运用NX软件的知识融合和二次开发技术,建立产品装配知识管理系统,实现设计自动化,有利于设计知识的共享和重用,缩短产品开发周期.  相似文献   

17.
为了提高对复杂模糊信息的表示能力,提出一种扩展的模糊描述逻辑.扩展模糊描述逻辑引入模糊概念和模糊关系的截集形式作为原子概念和原子关系,继承经典描述逻辑中的概念构造器和知识库形式,建立新的知识表示逻辑体系.定义了扩展模糊描述逻辑的语法结构、语义解释、知识库形式以及基于可满足性的推理问题.通过与模糊描述逻辑的比较,阐述了模糊描述逻辑可转化为扩展模糊描述逻辑,从而例证了扩展模糊描述逻辑具有比模糊描述逻辑更强的表达能力.  相似文献   

18.
以KNS5.0平台检索关于个人知识管理研究的文献为依据,对我国现阶段个人知识管理的相关研究文献进行综述,根据摘要、主题词和内容,析出了关于个人知识管理的主要研究主题,并对主要和显著增长的几类分别从学者、文献、机构等方面进行概述和分析,最后,在对相关文献进行评述的基础上对未来的研究提出了建议.同时预测了国内未来个人知识管理研究的新主题和方向.  相似文献   

19.
传统方法采用数据挖掘的方式构建运维数据关联知识库,返回的关联信息并非用户想要的最终结果,不符合用户意图。为此,提出一种新的基于语义分析的运维数据关联知识库构建方法。给出运维数据关联知识库结构。采用文档主题生成模型LDA获取关键词,通过语义相似度求出知识案例与检索词间的相近程度,将和检索词相似度最高的结果作为检索结果。对运维知识项的各个属性赋予权值,依据构成元素的权值与知识库各个属性的匹配关系计算权值和,求出相似度。采用关键词权重量化法对检索结果进行处理。将构建知识库应用于动车系统中,结果表明,通过构建知识库可有效检索运维数据关联知识,为运维人员提供依据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号