首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 421 毫秒
1.
针对现有的基于孪生网络结构的文档相似度计算方法大多将整个文档看成模型的输入序列, 易导致数据稀疏的问题, 提出利用层级注意力机制来改进孪生网络结构中的文档表示。针对基于层级注意力机制的孪生网络计算模型在输入时有可能忽略文档中重要句子的问题, 进一步提出一种引入文档内容压缩的两步骤文档相似度计算方法。利用开发的法律案例文档相似度标注数据集进行实验, 结果表明所提方法明显优于基于长短期记忆模型的孪生网络计算模型。  相似文献   

2.
少样本学习旨在利用少量数据训练深度学习模型,并将其快速泛化到新任务中.在这一领域,少样本细粒度图像分类是最具有挑战性的任务之一,原因在于细粒度图像具有类内方差大、类间方差小的特点.为了解决这一问题,本文提出了一种基于距离与方向双重度量的神经网络,分别利用欧氏距离衡量特征间的绝对距离差异和余弦相似度衡量特征间的相对方向差异,以提升度量信息多样性和样本特征的判别性.同时,为了与当前先进的少样本细粒度图像分类方法对比,将特征提取器在不增加深度的前提下设置为双路形式,以适应不同度量方法对嵌入特征信息的需要.此外,设计了彼此分离的通道和空间注意力机制,分别通过自适应通道注意力和空间信息交叉注意力对不同阶段的提取特征进行增强,从而挖掘重要分类信息.最后,通过双相似度模块分别计算两种差异信息的度量结果,并选取一定权重融合得到最终的相似度分数,实现绝对差异与相对差异在度量空间中的协调补充.在4个主流细粒度图像分类数据集上进行实验对比与分析,最终结果表明了所提方法在相同设置下最多实现了7.0%左右的分类准确率提升.  相似文献   

3.
苟和平 《科学技术与工程》2013,13(16):4720-4723
针对KNN算法在分类时的样本相似度计算开销大,在处理不均衡数据集时少数类分类误差大的问题,提出一种在不均衡数据集下基于密度的训练样本裁剪算法。对训练样本的各个样本类进行聚类,删除噪声数据并计算每个样本类的平均相似度和样本平均密度,以此获得样本类裁剪的相似度阈值,然后将样本类内相似度小于类相似度阈值的样本进行合并,减少训练样本总数。实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,有效地减少分类计算开销,并能在一定程度上提高少数类的分类性能。  相似文献   

4.
在行人重识别模型中引入邻域数据关系,提出了一种基于图像邻域相似度的重排序方法。首先扩充图像的邻域数据,然后计算图像对不同邻域数据的相似度权重,利用该权重得到代表邻域相似度的分布距离,再用分布距离与原始距离计算得出最终距离作为重排序评判标准。使用CCL,Transreid, Torchreid等行人重识别模型在Market-1501,DukeMTMC-reID数据集上进行实验,结果表明本文方法对基准模型的精度提升均超过该领域的主流算法,证实了本文方法的有效性和泛化性。该重排序方法不需要任何人工交互和额外数据,适用于大规模数据集,可以有效应用于图像检索、目标跟踪等需要考虑相似度关系的任务中。  相似文献   

5.
在计算机辅助眼底图像视网膜血管分割中,基于匹配滤波算法的应用非常广泛.而传统匹配滤波器算法存在分割细小血管效果较差、噪声多以及视盘干扰等问题.本文提出一种相似度滤波算法的眼底图像视网膜血管分割方法.首先用多层阈值和水平集算法提取视盘干扰区域,利用高斯模糊去除视盘干扰区域.然后采用相似度滤波运算对去除视盘干扰的彩色眼底图像进行处理.最后,将余弦相似度图进行二值化后与余弦相似度加强图进行区域连通性判断,实现眼底图像视网膜血管分割.结果 表明,该算法能较好地分割细小血管以及去除视盘干扰,能更为准确地提取眼底图像视网膜血管.  相似文献   

6.
为提高黏结集料图像的分割精度,提出了基于Inception网络与残差连接优化的黏结集料图像分割模型(Multi-ResUnet模型)。利用实验室自主研发的集料三维特性分析系统V3.0对黏结集料图像进行采集,并建立图像分割模型样本集,然后采用图像分割模型对样本集进行训练。结果表明:相较于分水岭算法和Unet模型,该图像分割模型的精确率分别提升了30.46%和2.11%,召回率分别提升了4.68%和1.85%,准确率分别提升了25.95%和2.47%。  相似文献   

7.
针对现有本体映射过程中相似度计算方法的精度及效率的不足,提出一种新的综合概念相似度算法模型,该算法分别对本体概念的名称、属性和实例相似度进行计算,过程中融合了信息增益和聚类集方法,并最终对三种相似度量结果加权综合。实验表明,算法得出的概念相似度计算结果在合理性和准确率上都有所提高。  相似文献   

8.
针对目前人才引进的定量研究不足的问题,提出了基于知识定量表示的人才引进多目标模型.首先构建知识超网络,确定组织需要的知识,并给出人员知识的表示形式.利用相似度算法,计算组织需要的知识和人员所拥有的知识的相似度.以相似度值为输入条件,建立整体选择人员的多目标模型,该模型既考虑了组织的知识需求,又考虑了人才引进后,组织成员之间的知识交流效果.为了给引进人才排序,提出了分步引进人才的多目标模型.对模型的计算复杂度进行了理论分析,并通过实例验证了模型的有效性.  相似文献   

9.
随着卷积神经网络(Convolutional Neural Networks,CNN)的不断改进,基于CNN的图片匹配成为图像处理的关键,然而,许多基于CNN的图像相似度检测算法对图像特征的表达能力较差,且曼哈顿距离或欧式距离的计算方式导致在计算损失函数时模型不一定能很好地收敛.针对此问题,提出一种基于孪生网络和注意力机制的方法(CSNET)来提升图像匹配的性能,主要步骤如下:使用将激活函数改进为Mish函数的VGG16网络作为主干网络提取图像的特征,在模型的卷积层加入注意力机制模块(Convolutional Block Attention Module,CBAM),这提高了模型的特征提取能力和鲁棒性,保证训练可以收敛.对模型输入图片对的特征向量的欧氏距离,再利用网络全连接层输出的相似度分数来度量被检图片是否相似.将提出的CSNET与其他图片匹配方法在Omniglot和SigComp2011等数据集上进行比较,实验结果表明,CSNET能有效提高图像相似度匹配的准确性.  相似文献   

10.
【目的】自训练方法易选出低置信度的无标记样本去训练分类器,在训练中也易误标记无标记样本导致错误累积,针对这些问题提出结合相似度选择高置信度样本的朴素贝叶斯自训练方法。【方法】选择朴素贝叶斯作为基分类器,在迭代中通过相似度计算方法计算样本相似度,选择同时满足相似度阈值和类别号判别一致的无标记样本加入训练集。【结果】在UCI数据集的对比实验中发现,提出的新方法的分类正确率高于其他对比算法。【结论】新方法能够利用少量有标记样本和不断添加的置信度高的无标记样本去训练分类器,提高分类精度,解决了自训练方法因有标记样本集初始分布不均导致准确率较低的问题。
  相似文献   

11.
针对目前小样本学习中存在的问题,设计一种新的网络结构及其训练方法以改进小样本学习.该网络在特征嵌入部分采用卷积网络并结合多尺度滑动池化方法以增强特征提取.网络主体结构为类孪生网络,以便于通过样本间的对比从小样本数据中学到语义.网络的训练方法采用嵌套层次的参数更新以保证收敛的稳定性.在两个经典小样本学习数据集上与常用的视觉模型和前沿小样本学习方法进行了对比实验,实验结果表明,该方法在小样本学习的精度上有显著提升,可作为样本不充足情况下的解决方案.  相似文献   

12.
平行句对抽取是解决低资源神经机器翻译平行语料不足的有效途径.基于孪生神经网络的平行句对抽取方法的核心是通过跨语言语义相似度判断2个句子是否平行,在相似的语言对上取得了非常显著的效果.然而针对英语东南亚语言双语句对抽取任务,面临语言空间和句子长度存在较大差异,仅考虑跨语言语义相似度而忽略句子长度特征会导致模型对仅有语义包含关系但不平行句对的误判.笔者提出一种结构特征一致性约束的双语平行句对抽取方法,该方法是对基于孪生神经网络的双语平行句对抽取模型的扩展,首先通过多语言BERT预训练语言模型在嵌入层将两种语言编码到同一语义空间,以此缩小语义空间中语言的差异.其次分别对两种语言句子的长度特征进行编码,与孪生网络编码后的句子语义向量进行融合,增强平行句对在语义及结构特征上的表示,降低模型对语义相似但不平行句对的误判.在英缅双语数据集上进行实验,结果表明提出的方法相比基线模型准确率提高了4.64%,召回率提高了2.52%,F1值提高了3.51%.  相似文献   

13.
为提高软件项目案例相似度算法的精确度,在分析传统的基于匹配函数的相似度算法基础上,结合软件项目案例的特点,建立了基于神经网络的软件项目案例相似度算法模型,通过对已完成项目案例学习,模型自动计算案例各个特征之间的权重,解决了人为给定特征权值的主观性,使软件项目案例相似度的更加准确,为软件项目相似案例搜索提供依据.  相似文献   

14.
通过研究网络结构上的观点传播与协同过滤算法,基于对观点传播算法的优化,提出了基于用户相似和物品相似推荐系统评分预测算法.设计的算法修正了现有相似研究中在目标比较相似时,相似性结果为零的问题,将用户(或物品)的相似度定义为用户(或物品)间的观点数目和差异在相应复杂网络中的传播结果,并提出了相应的推荐算法.在MovieLens数据集上的实验结果证明,提出的算法与几种典型的现有方法相比较,具有更高的准确性,并且优于观点传播算法.  相似文献   

15.
特定领域的FAQ问答系统通常存在以下3个问题:(1)如何有效地对句子进行语义表示;(2)如何有效地进行句子间的语义匹配;(3)领域词汇的分词问题。为解决上述3个问题,提出一种基于Tri-BiLSTM-CNN的深度学习模型。首先,将双向长短期记忆网络和卷积神经网络结合构建网络模型,综合利用了BiLSTM处理序列化数据的优势和CNN捕获局部特征的优势。然后,采用Triplet并列式排列结构进行句子之间的匹配。最后,使用字向量替代词向量,避免了分词错误对模型的影响。在钻井安全领域的真实数据集上进行实验验证,结果表明,Tri-BiLSTM-CNN模型能更好地对句子语义进行向量化表征,显著提升句子相似度计算的准确率,而且效果明显优于CNN和LSTM两种网络结构。将该模型用于钻井安全领域的FAQ问答系统中,有效减少了人工成本,对改善钻井工作的效率和质量具有重要意义和应用价值。  相似文献   

16.
目标检测是计算机视觉的基础任务之一,其主要任务是对图像中的目标进行分类和定位。小样本目标检测的目的就是利用极少数的训练样本实现对目标的检测,从而减少繁杂的标注工作,并实现在只有少量样本场景下的应用。现有的小样本目标检测方法主要包括基于孪生神经网络的方法和基于微调的方法,这些方法通过利用现有的包含大量样本的基类数据集和包含少量样本的小样本数据集的训练,使模型实现对小样本类别的分类和定位。重点调研了基于孪生神经网络的双分支小样本目标检测方法,简要介绍了基于微调的小样本目标检测方案,分析了这些方案的优缺点,指出现有的小样本目标检测方案虽不成熟,模型精度有待提升,性能评估方案也有待完善,但却有着十分广阔的应用前景,未来若能通过深入研究解决小样本目标检测的现有问题,其精度必将赶超传统目标检测。  相似文献   

17.
医学图像分割是图像处理的重要环节,而细胞核分割结果是病理学家进行癌症分类和评级的重要依据,提高其分割的准确率一直是研究的热点。但由于同器官的不同细胞核存在形态可能不一样、细胞之间相互重叠、细胞边界不清楚等现象,导致细胞核图像难以准确分割。为提高相互接触和重叠细胞核分割的准确性和精确率,本研究提出一种新型的细胞核分割网络模型。该模型首先是对原始细胞图进行ZCA白化预处理,并基于经典的U-Net网络结构,通过U-Net和ResNet残差模块进行训练,使用Batch Normalization方法实现数据归一化处理,解决训练过程中梯度震荡问题。在MoNuSeg和ISBI2018Cell两个数据集上的实验结果表明,本研究所提出的模型的分割准确率较高,分割出的细胞没有出现细胞核大面积粘连的现象,细胞核轮廓更加清晰。本研究所提的分割网络基于经典的U-Net网络结构,通过构造ResNet残差模块实现对细胞核上下文特征的提取,同时在残差模块使用Batch Normalization使得梯度的传输更加便捷,减少了训练时间,而且在分割相互接触的细胞核时,具有精确定位和准确分割的能力,是一种有效的细胞核分割方法。  相似文献   

18.
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。  相似文献   

19.
图像语义分割和实例分割是计算机视觉领域基础挑战性工作,图像全景分割统一解决两者的任务,其核心为图像中每一个像素分配相应的类别标签以及为类别中每一个实例分配ID。经典UPSNet已经取得了较好的全景分割效果,但是使用了一种单向信息流动的特征金字塔网络,将存在实例分支的目标实例定位不够准确的问题,并且语义分支的语义分割能力还需进一步提升。本文通过考虑两个任务的差异性以及共性,重新设计特征金字塔网络结构以提取出更适合全景分割的特征图,从而提高了实例分支的AP评价指标。在语义分支中引入了克罗内克卷积,与可变形卷积进行融合使得特征图的感受野更大并且捕获了局部信息,使语义分支的mIoU评价指标得到了提高。此模型在Cityscapes数据集上进行实验,验证了所设计的每个模块及整个模型的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号