首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对信息检索模型检索性能的问题,将本体及本体语义相似度度量方法运用于基于贝叶斯网络的信息检索模型中,通过利用领域本体表达信息的规范性及本体语义推理的准确性对查询需求进行扩展,提高查询的性能。给出了信息检索模型和概念语义相似度计算及查询检索方法与过程,实验证明该方法在一定程度上能够提高检索系统的性能。  相似文献   

2.
一种改进的基于树路径匹配的网页结构相似度算法   总被引:1,自引:0,他引:1  
提出一种改进的基于树路径匹配的网页结构相似度算法, 该算法定义了树路径的序列相似度和位置相似度, 找出网页的树路径集合, 通过网页间的最佳树路径匹配计算结构相似度. 实验结果表明, 用改进后的算法计算网页结构相似度比传统树路径匹配方法更符合实际, 更合理有效.  相似文献   

3.
针对传统图书检索系统只是基于关键字的检索,无法进行语义扩展,存在查全率和查准率不高的问题,将具有良好概念层次结构和对逻辑推理支持的本体引入到图书检索中,并设计了语义扩展算法和相似度算法,实现语义分析、语义扩展和相似度计算等功能,建立基于本体的图书信息检索的系统模型.结果表明,该系统能够在一定程度上增强检索系统的语义处理能力,改善传统检索系统的漏检、无效检索和检索结果过于无序和冗杂的缺点,使检索效率得到了改善.  相似文献   

4.
为了解决基于内容的图像检索(content-Based Image Retrieval,CBIR)中存在的“语义鸿沟”问题,本文提出了一种CBIR检索模型,在模型中使用了基于近邻传播的半监督聚类算法和语义传播的算法,通过近邻半监督算法对图像库中的图像进行聚类,根据示例图像的视觉特征相似度在对应的聚类图像中进行相似度检索,在检索的结果中根据用户提供的关键字进行关键字标注检索,最后根据用户的反馈,通过语义传播算法对图像库中的图像进行自动语义标注.实验表明丈中的模型是可行的,其检索效果受到反馈次数的影响.  相似文献   

5.
针对哼唱检索中匹配过程的耗时性和哼唱的非完全准确性,提出了并行模糊动态时间规整算法实现音乐的哼唱检索。采用相对音高差表示旋律,用动态时间规整算法实现哼唱音高差序列与目标音高差序列的近似匹配。在匹配过程中,引入模糊集合及模糊聚类,通过构造哼唱音高差与目标音高差之间的隶属函数并计算隶属度得到音高差信息的相似度,进而获得转换代价矩阵,最后得到两个匹配序列的匹配距离。为提高检索速度,引入并行算法实现匹配过程。实验结果表明,模糊方法的引入提高了检索精度,并行算法的运用明显缩短了检索时间。基于并行模糊动态时间规整算法的音乐哼唱检索的正确率达到72%左右,在双核计算机上进行实验,引入并行算法后检索时间缩短一半。  相似文献   

6.
细粒度语义网检索   总被引:6,自引:0,他引:6  
语义网的有向标记图数据模型决定其在内容检索方面与纯文本、超文本或半结构化文档检索存在较大差异.现有检索模型和相似度计算方法不能完全满足对语义网的检索和评价.该文以资源这种较细粒度作为检索单元,考虑查询关键字在资源内容中的频率和结构分布,提出一个细粒度语义网检索模型,并扩展了相似度计算公式和倒排索引结构.在语义网挖掘系统(semantic web aiding rich miningsystem,SWARMS)中实现了该模型及相关算法.在SourceForge和DBLP两个测试集上的实验表明,该模型能够结合语义网结构查询与基于关键字的内容查询,在相同查全率下查准率是单独应用结构或内容查询的两倍左右.  相似文献   

7.
煤矿重大瓦斯事故案例推理应急决策方法   总被引:1,自引:0,他引:1  
针对煤矿重大瓦斯事故发生时由于井下复杂、封闭的环境,很难获取较全面、准确的事件信息等问题,采用基于情景检索的事故案例推理应急决策方法,设计其应急决策具体流程,提出基于结构和属性的双重情景检索策略,引入结构相似度的计算方法改进最近相邻检索算法,实例应用表明,该方法克服了因事件信息缺失而导致相似度计算结果不准确的弊端,避免了由于信息缺失导致的案例推理检索系统的失效性,可以有效提高案例检索的有效性和准确性,为煤矿重大瓦斯事故应急决策提供了更完备、更有价值的信息参考.  相似文献   

8.
基于最优ROC曲线的k-部排序本体算法分析   总被引:1,自引:0,他引:1  
本体相似度计算和本体映射被广泛应用于查询扩展和图像检索中,已成为信息科学研究的热点内容,其核心为计算本体图中顶点间的相似度.本文从理论的角度分析最优ROC曲线标准下k-部排序本体算法的性质,给出算法模型的单调性、广义误差、可微性等若干统计特征.  相似文献   

9.
针对基于路径的半结构化数据结构相似度度量方法不能很好地处理路径部分相似以及忽略了元素之间兄弟关系的问题,提出一种基于频繁关联标签序列的结构相似度度量方法,该方法将半结构化数据的结构信息视为标签序列的集合,采用数据挖掘技术中频繁模式和关联项集的概念及算法,从半结构化数据中挖掘频繁关联标签序列并以此作为特征计算其结构相似度.实验结果证明:提出的基于频繁关联标签序列的半结构化数据结构相似度度量方法可以解决基于路径方法的不足,计算的结构相似度更准确、更合理.  相似文献   

10.
基于向量空间的文档相似度算法假设特征元素间关系为正交,当2篇文档采用了具有相近语义的不同术语描述时,该方法不能准确反映二者的相似性.针对这种情况,文章利用词语的同义关系,在给出术语与术语组相似度、术语组和术语组间相似度的概念及算法的基础上,给出一种基于词语相似关系的文档相似度计算方法.实验采用科技文献类文档和新闻报道类文档作为测试集合,比较新方法和向量空间算法的分类性能,结果显示新方法可提高文档分类的准确性.  相似文献   

11.
基于投影序列质心的不规则形状识别   总被引:1,自引:1,他引:0  
以交通标记识别为例,针对不规则形状识别提出一种新的方法。选取不规则形状的边缘点做双向投影变换,根据归一化和中心化后的投影序列数据求得加权质量,从而得出投影序列的质心。由于相似质点系的质心距离相近,因此相似投影序列的质心也相近。以棋盘距离和街区距离的线性组合替代欧氏距离来度量投影序列及其质心的相似性,继而得到不规则形状的相似程度。实验结果表明,该算法在保持较高识别精度的同时,运算速率也比较快。  相似文献   

12.
稀疏表示人脸识别算法的主要思想是:一个未知的测试图像可以近似表示为所有与其隶属同类的训练样本的一个线性组合.然而,人脸之间存在着极大的相似性,同时易受到外部环境的影响,人脸分类的本身存在着一定的不确定性.针对这种不确定性,结合模糊集合理论,提出了一种新的模糊稀疏表示人脸识别算法.首先,引入一个非线性函数描述人脸的相似性程度.然后,基于该相似性度量以及最近邻分类器思想,定义一个自适应的模糊隶属度函数来分配人脸对类的隶属程度.而这一过程恰使得这些隶属度是稀疏化的.最后,将稀疏化的模糊隶属度作为训练样本表示测试样本的权值系数,进而重构测试图像.采用MATLAB在ORL和Yale人脸数据库上进行仿真实验,验证了该算法的有效性和稳定性.  相似文献   

13.
周期序列的错误线性复杂度是度量密钥流稳定性的一个重要指标.首先改写GF(q)上pn周期序列的k错线性复杂度快速算法,给出其m紧错线性复杂度的快速算法;然后研究相应k错线性复杂度的误差向量,得到计算误差向量的算法,即在此误差向量下,可以实现原始序列的k错线性复杂度.其中p为奇素数,q是模p2的一个本原根.  相似文献   

14.
聚类是识别基因表达数据蕴含的关键基因调控模块的一种有效方法,基因表达谱的相似性度量是聚类的关键问题.然而,一般的相似性度量方法不能刻画时间序列基因表达谱数据所蕴含的时间延迟、反向相关和局部相关等复杂的基因调控关系.针对时间序列基因表达谱数据,提出一种基于近邻传播和动态规划的相似性度量方法和聚类算法.在大鼠再生肝细胞基因表达谱数据集上的聚类结果与基因功能富集分析结果高度一致,证明算法在时间序列基因表达谱数据聚类上的有效性.  相似文献   

15.
核函数作为样本相似性的衡量尺度是影响支持向量机分类效果的重要因素。为了使相似性衡量尺度与样本特征的分布特点相适应,提出利用相似度分割特征集的混合核函数构造方法。通过研究每维特征在不同相似性函数下的区分能力,将特征集分割成相应的特征子集,并根据特征子集在分类中的重要性程度,对相应的样本相似度矩阵进行线性加权,得到最终的分类结果。实验结果表明,文中提出的混合核可以同时具有多种不同特性核函数的优点,改善了支持向量机分类器性能。  相似文献   

16.
为了有效求解带有时间窗的车辆路由问题,在标准遗传算法的基础上,引入两代竞争近距淘汰选择算子,用欧氏距离来判断个体之间的距离作为个体的相似程度,相似程度高且适应度差的个体被淘汰,并辅以循环交叉算子和插入变异算子,构造出了一种改进的遗传算法.仿真实验表明,改进的算法在迭代过程中能有效保持群体的多样性,避免出现早熟现象而陷入局部极值点,提高遗传算法的内在并行性.同时通过竞争淘汰,使局部搜索能力得到加强,加快了搜索速度.改进算法所计算出的结果优于用轮盘赌和自适应选择作为选择算子的遗传算法的结果.  相似文献   

17.
描述了两类线性控制系统异维相似性的概念,这种相似性推广了两个系统间同维相似和异维相似概念,并给出了判断两类控制系统异维相似的比较简单的方法,及相似参量的算法.  相似文献   

18.
一种新颖的图像相似性测度   总被引:1,自引:0,他引:1  
该文推导和定义了一种基于正交Proscrustes问题的图像相似性。此图像相似度是指一幅图像“旋入”另一幅图像的概率;同时简要地提供了图像相似度的算法,并将该算法用于船舶检测人脸的分类检索。实验结果表明新的图像相似性是有效和满意的。  相似文献   

19.
线性复杂度和k错线性复杂度分别是度量密钥流序列的密码强度和稳定性的重要指标。通过研究周期为2^n的二元序列线性复杂度.提出将k错线性复杂度的计算转化为求Hamming重量最小的错误序列。基于Games-Chan算法.讨论周期为2^n的线性复杂度为2^n-9的二元序列的4错线性复杂度分布,并给出了其对应4错线性复杂度序列的计数公式。  相似文献   

20.
0 IntroductionText clusteringis the process of grouping the documentsinto the classes or clusters so that documents within acluster have high si milarityin comparisonto one another ,butare very dissi milar to documents in other clusters .In applica-tions ,the document is always represented by vector spacemodel(VSM) in which each document is represented as a vec-tor and each unique termis of one di mension of this vector .Then,documents are clustered bycalculating distance or si mi-larity[1], …  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号