共查询到18条相似文献,搜索用时 156 毫秒
1.
概念相似度评估广泛应用于概念分类、概念聚合、概念合并等工作中.以往面向单本体概念相似度计算模型的工作虽然集中在概念特征匹配和语义分析之上,但考虑的要素单一或考虑要素的内容不全,所以计算结果精度不高,不利于概念关系的深层挖掘.该文完善概念的共性匹配,把概念间同时不具备的特征作为共性的一部分,并对概念格中不同层次的语义特征进行加权,从而提出一种具有高精度的面向单本体的概念相似度计算模型.实验数据表明该模型具有较高的精度. 相似文献
2.
基于知网的领域概念抽取与关系分析研究 总被引:2,自引:0,他引:2
唐一之 《湘潭大学自然科学学报》2009,31(1)
针对目前领域概念抽取手工完成的现况,提出了一种基于知网的领域概念抽取和关系分析系统模型.本模型利用知网语义相关性从文本中生成领域语义词典,结合TFIDF算法建立"词-文本文档矩阵",用以代替传统的词形频率统计;通过产生领域语义本体,利用语义相似度对概念进行聚类.讨论了这3个步骤所涉及的算法,包括基于统计模式从文本中抽词,基于奇异值分解从词-文档矩阵中提取概念,基于语义相似度对概念进行聚类等.实验表明,本文提出的抽取方法相对与词频算法具有较高的准确度. 相似文献
3.
针对在自然语言处理中起着关键作用的文本相似度计算问题,提出了一种神经网络深度学习的词向量模型计算方法.利用词向量计算文本语义相似度,并采用高频词滤波的方法削弱扰动的影响.对百度新闻、新浪新闻等的中文词库进行训练,并与传统的检测方法进行对比.实验结果证明了提出方法的有效性和准确性. 相似文献
4.
5.
语义信息集成是目前屏蔽数据之间半结构性、异构性和分布性的主要方法,其目的是为用户提供最大范围的精确数据.本文以解决信息集成中的语义冲突为目的,采用Ontology描述全局数据概念、树型结构描述局部数据概念.在此基础上,给出数据的逻辑定义方法,利用相似度计算匹配值来实现数据在语义集成中的匹配,并描述语义信息集成中的映射算法.最后,给出了实验数据和算法执行结果,验证了此方法的正确性. 相似文献
6.
基于异或编辑距离算法的航班号相似度研究 总被引:1,自引:0,他引:1
航班号是执行运输航空任务航空器的主用识别标志,但相似航班号会严重影响管制运行效率和航空安全.目前,相似航班号的判断主要依赖管制员的管制经验,对其尚无相关定量研究方法.该文在用于文本相似度定量比较的编辑距离算法基础上,提出了航班号相似度计算的异或编辑距离算法,并利用北京区域管制中心的实际运行数据验证了该算法的可行性.根据该方法计算了国内主要航空公司的平均相似度,相关结果可为航班号的分配提供定量参考. 相似文献
7.
结合图像的形状特征、纹理特征和颜色特征,提出一种面向制造过程的海量图像高效检索算法.算法利用傅立叶描述子法和二维形状分布法描述图像的形状特征,利用灰度共生矩阵描述图像的纹理特征,利用颜色直方图表达图像的颜色特征.在得到图像的形状特征、纹理特征和颜色特征后,分别采用欧式距离、马氏距离和夹角余弦距离计算这三种特征的相似度,最后对三种特征的相似度进行综合,得到图像的整体相似度,实现多特征的联合检索.仿真结果表明,本算法应用于不同类型和格式的海量数字图像,具有较高的检索精度和较快的检索速度. 相似文献
8.
9.
提出了一种针对网页结构树的相似度计算方法,首先把网页标签结构表示成树,然后通过动态规划算法,使两棵树在每一层上最相似的儿子节点继续进行比较,而那些没有找到匹配节点的儿子节点则产生距离,累加这些距离作为两棵树之间的距离,以此来衡量两个网页之间的相似程度。实验证明本方法可以正确区分同类网页和不同类网页。 相似文献
10.
针对海量时空轨迹数据相似性查询速度慢的问题,提出一种融合图结构的时空轨迹相似性查询算法。从空间维和时间维将轨迹建模为图结构中的一条路径,设计了一种同步匹配空间和时间距离的轨迹相似性度量函数。在此基础上,设计了一种结合时间过滤的基于边的倒排索引结构支持轨迹时空相似性查询,同时利用距离上界的剪枝策略提高查询性能。计算返回的相似轨迹集合中每条轨迹的距离并进行排序,得到相似度最高的前k个轨迹。最后将所提算法与NTrajI算法、SHQ算法、SHQT算法在合成数据集和真实数据集上进行实验对比。结果表明:该算法在索引建立、查询效率和查询质量方面均优于其他对比方法,因此是可行而有效的。 相似文献
11.
12.
13.
应用整数小波变换的抗盲检测图像隐写 总被引:1,自引:0,他引:1
在分析通用盲检测方法原理的基础上,提出一种通过修改整数小波高频系数实现消息嵌入的隐写法. 该方法使用小波去噪门限作为消息嵌入的阈值,在大于该门限的小波高频系数中嵌入消息,并在阈值处引入直方图补偿策略使小波系数直方图近似保持不变. 由于通用盲检测方法大多利用概率密度函数的变化实现检测,因此该文提出的方法可以获得对通用盲检测算法的抵抗力. 实验结果表明,该方法在抵抗小波高阶统计量分析、直方图特征函数质心等盲检测法的能力方面,优于LSB匹配、像素值差分等隐写法. 相似文献
14.
15.
在比较目前特征提取和匹配的几种方法比较的基础上,提出了一种基于改进特征提取和匹配的拼接方法,使得图像拼接的质量和速度得到提高。该算法首先利用改进的尺度不变特征变换(scale invariant feature transform,SIFT)特征提取方法获得图像特征点,其次利用近似最近邻匹配进行特征匹配并引入随机抽样一致性(random sample consensus,RANSAC)算法去除误匹配对,最后根据匹配的特征点对得到图像间的变换参数进行拼接和融合。该算法具有很强的鲁棒性,允许图像有缩放变换、旋转变换,不受图像噪声、色差的影响。经实验证明,该方法可实现高质量快速的拼接系统。 相似文献
16.
基于Vague集的元素间相似度量的近似推理 总被引:7,自引:0,他引:7
给出了Vague集元素间的一个相似度量方法,对于模糊概念(用Vague集表示)的隶属函数为连续的情况,将规则前件中Vague集的论域与后件中Vague集的论域作一一映射,然后给出基于Vague集的隶属函数为连续情况下的元素间相似度量的近似推理方法;对于Vague集的隶属函数为离散的情况,在作上述相同的映射后,再将规则前件中的vague集和事实中的Vague集的真/假隶属函数分别进行线性插值,使它们都成为连续函数,然后给出基于Vague集的隶属函数为离散情况下的元素间相似度量的近似推理方法. 相似文献
17.
为提高拷贝检测系统的鲁棒性和效率,提出一种鲁棒图像哈希算法. 用Gabor变换系数构建图像内容结构图,将它从笛卡尔坐标系变换到极坐标系进行归一化. 将归一化的结构子图加权,求得特征向量,最后通过量化得到二值哈希码. 基于Gabor系数的内容结构图有很强的鲁棒性和独特性,量化中采用的失真哈希码融合和双密钥进一步提升了算法的鲁棒性、独特性、紧凑性. 利用公开数据库分别对所提出的算法和多种代表性算法进行对比实验,比较对象包括非负矩阵分解哈希、形状上下文哈希、圆环分割与不变向量距离哈希. 实验表明,该算法在查准率和查全率方面均表现突出,匹配效率也有大幅提升,整体性能优于对比算法. 相似文献