首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
现代战争需要对多源异构的装备数据进行高效集成。针对不同来源数据中装备名称不一致的问题,设计了装备数据的聚合模型和聚合流程,在综合分析现有算法的基础上,结合装备名称特点为该模型提供了一种新的相似度匹配算法,算法将Jaro-Winkler和最长公共子序列相结合,以提高匹配的精度。最后通过实验进行了验证,结果表明该算法与传统相似度算法相比具有较高的适配性和鲁棒性,可以为装备数据聚合工作提供有效支撑。  相似文献   

2.
基于相似度比较的文档碎片拼接到图像拼接   总被引:1,自引:0,他引:1  
刘婵 《科技资讯》2014,(4):63-63,65
随着计算机技术的发展,人们试图开发碎纸片的自动拼接技术,以提高拼接复原效率。本文基于相似度比较的原理在解决来自同一页印刷文字文件的碎纸机仅纵切的破碎纸片自动拼接修复技术的前提下,对来自同一页印刷图像文件的碎纸机仅纵切的破碎纸片进行了自动拼接,得到了较好的效果。  相似文献   

3.
相似性度量在大数据相关应用中具有重要的意义,然而传统余弦相似度遍历计算方法的准确性和时效性较差,具有较大局限性,无法为海量高维数据的质量评估提供有效依据。针对上述问题,利用余切三角函数和数据维度差值构造2种余切相似度公式,提高相似度计算的准确性;借助后向传播(BP)神经网络建立一个能够逼近数据集相似度映射关系的网络模型,降低相似度计算的时间复杂度。实验表明,改进的相似度快速计算方法具有良好的准确性和时效性,而且应用在大规模数据集时的性能提升更显著。  相似文献   

4.
针对基于路径的半结构化数据结构相似度度量方法不能很好地处理路径部分相似以及忽略了元素之间兄弟关系的问题,提出一种基于频繁关联标签序列的结构相似度度量方法,该方法将半结构化数据的结构信息视为标签序列的集合,采用数据挖掘技术中频繁模式和关联项集的概念及算法,从半结构化数据中挖掘频繁关联标签序列并以此作为特征计算其结构相似度.实验结果证明:提出的基于频繁关联标签序列的半结构化数据结构相似度度量方法可以解决基于路径方法的不足,计算的结构相似度更准确、更合理.  相似文献   

5.
为了提高嵌入式通信网络传输数据的传输质量,提出基于数学图论分析的数据相似度权重调整算法.构建嵌入式通信网络传输数据的模糊信息检测模型,分析数据传输动态模糊特征,采用数学图论分析进行嵌入式通信网络传输数据相似度权重调整过程中的自适应寻优,实现嵌入式通信网络传输数据的优化相似度权重调整.结果表明,在迭代次数分别为100、2...  相似文献   

6.
语句相似度计算是设计和实现智能答疑系统的关键技术.由于智能答疑系统一般面向受限领域的特点,在构建出其领域本体的基础上,利用本体语义树计算词汇相似度,从而计算出语句的语义相似度.最后,设计了一个实验模型验证了该语句相似度算法的有效性.  相似文献   

7.
提出一种基于余弦相似度的复杂网络故障检测方法。利用余弦相似度确定变量之间的相关性,得到邻接矩阵,进而构建变量之间的网络模型;结合系统的网络拓扑结构,计算相应的复杂网络度量指标,对比故障状态与无故障状态下的网络结构与度量指标的差异,确定故障源;最后利用Tennessee-Eastman(TE)过程故障检测实例,结果表明,与偏相关系数方法对比,本文所提方法能有效且更准确地检测出故障。  相似文献   

8.
基因聚类分析中数据预处理方式和相似度的选择   总被引:6,自引:0,他引:6  
聚类分析是基因表达数据分析研究的主要技术之一.选择恰当的数据预处理方式和相似性度量,是获得高质量聚类结果的前提.采用具有外部标准的基因表达数据集,分别以Pearson相关系数和Euclidean距离为相似度,以校正的Rand 指数比较了使用分层聚类、K-均值聚类和SOMs聚类算法对经过行标准化、列标准化和对数化处理后数据的基因聚类质量.结果表明:K-均值聚类和SOMs聚类质量显著优于分层聚类,SOMs聚类质量稍好于K-均值聚类.而且,分层聚类偏好于Pearson相关系数准则和行标准化处理,而应用K-均值聚类和SOMs算法时,则最好是对数据进行对数化处理、并以Euclidean距离为相似性度量准则.上述研究结论将为基因表达聚类分析的实施提供有价值的参考依据.  相似文献   

9.
基于SS/OSF实现高维稀疏数据对象的聚类   总被引:4,自引:0,他引:4  
为了解决传统聚类方法处理高维稀疏数据对象时聚类结果不理想的问题,提出了SS/OSF聚类方法.该方法基于对象组相似度(SS)和对象组特征向量(OSF),并借助对象组特征向量的可加性实现. 采用本方法得到高维稀疏数据对象的聚类结果后,可以根据聚类结果中各个对象集合的上确界和下确界为新对象进行对象组分类. 实验表明,与传统K-means聚类方法相比,随着数据对象数目的增加,该方法无论是在运行时间上,还是在聚类结果的准确度方面都有明显的改进.  相似文献   

10.
异构数据集成领域大量应用了本体研究方法.该文针对混合本体模型映射存在的不足提出了自适应混合本体模型,通过计算各种不同相似度获得相似度综合的计算方法.提出了自适应映射的定义和计算方法用以解决本体之间是否要进行映射的问题.  相似文献   

11.
基于海明距离函数,给出了Vague集2种新的相似度量方法.根据不确定信息处理的实际背景,利用Vague集的相似度量应该遵循的5项准则,对常见的几种相似度量性质进行了逐一检验,并将这几种相似度量进行比较,指出了它们的不足.  相似文献   

12.
将基于包含度的数据挖掘方法引入到高职学生VC成绩的分析之中,得出了有意义的约简和针对性的规则,通过实验研究,表明该方法得到的实用规则,在以后提高教学绩效方面具有较大实用价值.  相似文献   

13.
针对现有相似性比较算法对模型的局部细节特征描述不足的现状,提出了一种零亏格三角网格模型形状相似性比较的新方法.在对三角网格模型进行姿势配准以后,映射三角网格模型到单位球上,并用多种曲率生成球面混合曲率图像,然后用球面调和函数对其分解,提取一维旋转不变的形状描述子进行相似性比较.实验结果表明,采用球面混合曲率图像可以对三角网格模型中不同类型的曲面进行清楚的区分;文中提出的方法能更细致地区别三维模型,对网格分辨率鲁棒且特征提取稳定,因此可以提高三维模型检索的有效性.  相似文献   

14.
性状比较的结果数据有助于家蚕优良亲本选择和性状改良工作.人工比较家蚕性状的工作量大,效率低,且易出错.以家蚕茧层率性状比较为例,提出一种基于数据划分的家蚕性状比较方法,把家蚕茧层率数据按比较年季和比较均值分为2类,分别计算性状趋势、性状均值变化率和综合性状均值变化率等成绩,利用线性回归、方差分析等统计方法,比较3个家蚕品种连续10年春蚕期的茧层率.实验结果显示,该方法能够灵活地对任意家蚕品种、任意蚕期数据段比较性状指标,是一种通用的性状比较方法,具有一定的实用性.  相似文献   

15.
计算文本相似度常用的方法是计算以VSM表示的文本之间的夹角余弦值,但这种方法并没有考虑文本中词语之间的语义相似度.另外由于计算余弦值时要考虑VSM向量对齐,从而导致计算的高维度、高复杂性.《知网》作为一个汉语常用的知识库得到广泛的研究,利用该知识库能方便地求得汉语词语之间的相似度.利用《知网》计算每篇文本中词语之间的相似度,对VSM进行改进,用少量特征词的TF/IDF值作为改进后的VSM向量中的权重,进而计算文本之间的相似度.通过比较改进前后的VSM的维数、召回率和准确率,结果显示,改进后的算法明显降低了计算的复杂度并提高了召回率和准确率.  相似文献   

16.
提出了一种基于资源相似性的Web访问序列模式的相似度量方法,并且考虑了用户访问资源的时间因素,经过检验,证明其能够有效真实地反映实际情况。  相似文献   

17.
基于相似性理论的弹药相似性分析   总被引:1,自引:0,他引:1  
在介绍相似理论的相关问题的基础上,着重介绍了权重值的计算方法,进而给出了系统相似度的概念和公式。并举实例说明了利用相似理论计算弹药相似度精确值的可能性及在具体计算过程中需要考虑的一些问题。  相似文献   

18.
离群点检测在是数据挖掘的重要领域,广泛应用在信用卡欺诈检测、网络入侵检测等重要方面,文中在结合层次聚类和相似性,给出高维数据的相似度量函数与类密度的概念,并基于类密度重新定义高维数据的离群点,从而提出一种基于相似度量的离群点检测算法;实验表明:算法对高维数据中的离群点检测有一定的价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号