首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 562 毫秒
1.
对第一轮检索的结果文档进行重新排序,以提高顶端结果的准确率,一直是信息检索研究中的基础和关键热点问题。文章在考虑文档与文档的基础上,充分考虑了文档与关键词项以及词项与词项之间的多种关系,提出了一种基于流形学习的检索结果重排序的方法。将文档-文档,文档-关键词项,以及词项-词项这三种关系利用流形学习模型进行融合,然后通过正则化框架,在第一轮检索结果分数的基础上,进行文档重排序。在CLEF数据集上进行的实验表明,与基于图的文档重排序,基于LDA模型的文档重排序等方法相比,文中提出的方法可以更好地提高检索准确率。特别是在奥地利图书馆数据集中,采用MRR评估方法,文章所提出方法的准确率比表现最好的基线系统提高了11.78%,比第一轮检索结果提高了33.46%。  相似文献   

2.
文档中的关键实体可以抽象概括文本所描述的事件(或话题)的主体,推动面向实体的检索和问答系统等方面的研究.然而,文档中的实体是无序的,对文本中的实体进行排序显得尤为重要.提取文本实体特征并借助维基百科和词汇分布表示引入外部特征,提出了一种基于前向分步算法(Forward Stagewise Algorithm,FSAM)的排序模型LA-FSAM(FSAM based on AUC Metric and Logistic Function).该模型利用曲线下面积(Area Under the Curve,AUC)准则构造损失函数,逻辑斯谛函数整合实体特征,最后使用随机梯度下降法求解模型参数.通过LA-FSAM与基线方法的实验对比证明了所提方法的有效性.  相似文献   

3.
人们对大语境神经网络机器翻译(如文档翻译和多模式翻译)越来越感兴趣.目前,虽然有多个研究学者提出了新的网络架构或评估方法,但在大语境翻译模型内,潜在有用的语境信息有时仍会被忽略.文章提出了一种新颖的学习算法,即通过使用多级成对排序损失函数,将其他的语境信息纳入神经网络翻译模型考虑范畴.在文章中,通过使用文档翻译中基于转换器且大语境翻译系统,来评估所述出的学习算法.通过实际语境和随机语境,我们比较该算法的性能,并得出经过文章所述的算法训练的模型对附加语境信息更为敏感.  相似文献   

4.
在互联网信息检索中,多样化排序方法力求在排序结果列表靠前的位置为用户提供多样的结果文档.文中提出一种基于聚类和用户点击的在线多样化排序算法CRBA,通过结合文档的相似性以及用户的点击反馈,在与用户的不断交互中为用户提供多样化的排序结果.该算法将在线和离线的思想进行融合,既可以利用主题聚类的优点,根据主题对候选文档集合进...  相似文献   

5.
基于排序学习的文本概念标注方法研究   总被引:1,自引:0,他引:1  
提出一种基于排序学习的方法CRM (concept ranking model), 来实现文档的维基百科概念自动标注。首先人工对一定规模的文档进行概念标注, 建立训练集合, 然后利用排序学习算法在多项特征上得到对概念排序的模型, 利用这个概念的排序模型对任意文档进行概念标注。实验表明, 相对于传统的文档概念标注方法, 此方法在各类指标上都有相当大的提高, 标注结果更加接近人类的概念标注。  相似文献   

6.
在半监督聚类算法中,通常利用有标签样本的指导来提高数据的聚类效果,但不同样本对聚类结果的重要性并未充分考虑。为了解决这一问题,该文提出了一种基于自步学习的自适应半监督聚类算法(ASSCSPL)。首先,在模型中引入自适应损失函数,可以通过调节自适应损失参数提高模型的鲁棒性;其次,在模型中引入自步学习机制,用来刻画不同样本对聚类结果的不同重要程度;最后,在标签传播阶段,所得算法能够很好地利用已有的监督信息,为无标签数据赋予相应的标签权重。数据实验表明,与现有优秀算法比较,所提算法可以达到更好的聚类效果。此外,实验结果也表明,所提算法能够有效地降低噪声对模型聚类性能的影响。  相似文献   

7.
Learning to Rank(L2R)技术是对搜索结果进行排序,是近几年的研究热点。现关于L2R中的PairWise方法进行研究分析,PairWise方法将排序问题转化为二元分类问题,其缺点是只考虑两篇文档的相对顺序,而不考虑文档出现在搜索结果列表中的位置。另外,不同的查询拥有的文档对数目不同,结果会向拥有文档对较多的查询偏移。对常用的PairWise算法的损失函数及其求解方法、基本思想、算法框架、效用评价以及算法应用进行概括分析。  相似文献   

8.
针对现有数学检索排序方法所存在的排序属性单一问题,提出一种基于犹豫模糊距离的科技文档多属性综合排序方法。归纳科技文档的评价特征,确立了包括数学表达式几何属性、文档重要性属性和全局属性的三元组;建立以数学查询表达式为标准的科技文档犹豫模糊集,定义了各指标对应的犹豫模糊隶属度函数;利用犹豫模糊集在多属性决策方面的优势,采用文档相似度评价方法对检索结果进行排序。不同领域包含345027个数学表达式的19964篇科技文档的排序对比实验,表明本方法比科技文档单一属性排序方法的合理性有一定的提高。  相似文献   

9.
一种改进的Lucene语义相似度检索算法   总被引:2,自引:0,他引:2  
 Lucene的基础上,结合检索词项的语义信息,利用外部词典Wordnet分析检索词项与被检索文档中词项的语义相似度,在此基础上实现对文档语义信息的检索。通过分析现有的相似度量函数的核心特征,选择合适的语义相似度量方法,提出了一种新的词项语义相似度检索函数,该函数能够对检索文档按照语义相似度进行排序。实验结果表明,所提出的方法能够有效地提升文献检索的准确度。  相似文献   

10.
搜索结果的合成是元搜索引擎系统中一个重要的技术问题。为了提高元搜索引擎的查询精度,提出了一种改进的元搜索结果合成算法。通过分析搜索结果列表中包含的文本信息,综合考虑搜索结果与查询的匹配完全程度和相关程度给出了文本分析的规范化方法,并结合搜索结果的排序信息计算文档的相关分值,据此实现对局部相似度的调整。利用成员搜索引擎的性能评价,提出了改进的影子文档方法估算非相关文档的相关分值。然后,采用基于群决策的合成方法对搜索结果进行一致性排序。在实际Web环境中进行了测试,实验结果表明采用本算法,搜索结果的相关性比Round-robin、CombSum和CombMNZ三种合成算法有较大提高。  相似文献   

11.
为了提高覆冰电网图像的检索性能,提出一种基于自编码器的深度对抗哈希方法。首先,通过在现有的生成器和鉴别器之上添加新的编码鉴别器以鼓励生成的图像样本更好地表示真实数据分布。其次,构建哈希编码网络以学习生成紧凑的二进制哈希码。我们在WGAN-GP损失的基础上引入了新的基于长尾柯西分布的交叉熵损失和量化损失函数以优化汉明空间检索性能。实验结果表明,该深度对抗哈希方法能够通过编码鉴别器和柯西损失函数解决模式崩溃和图像模糊的问题,图像检索性能相比于其他方法有明显提高。  相似文献   

12.
在保证分类性能的前提下,如何从大量的训练样本集合中选择重要样本子集,是模式分类中的一个重要问题.基于该问题提出了一种新的样本选择算法,并将该算法应用于文本分类,在标准文档集Reuters-21578、复旦文档集和20newsGroup新闻组文档集上进行了实验.实验结果表明:该方法能有效地选取边界样本,且采用SVM和KNN分类能得到较好的分类结果,尤其是在不均衡文档集上效果更佳.  相似文献   

13.
为提高人脸图像情绪识别效率与准确性,在探讨了深度神经网络、注意机制与损失函数基础上,提出基于上下文感知与注意机制的多学习情绪识别网络结构.该网络主要由场景特征提取、身体特征提取与融合决策3个子网络组成,并采用单双输出结构,实现多标签情绪分类与连续空间情绪回归任务.考虑到多标签情绪分类时标签的不平衡性,提出了一个改进的焦点损失(focal loss,FL)函数,可为小样本或难分类样本分配更多的权重,从而提高了网络训练效率.利用EMOTIC数据集进行仿真,结果表明平均绝对误差回归组合损失训练性能更优,分类平均准确率与回归平均误差率分别为28.5%和0.098,该方法对于小样本或难分类样本具有更好的分类效果.   相似文献   

14.
在基于位置的社交网络中,用户签到矩阵极其稀疏,采用排序学习技术进行兴趣点推荐是目前的热门研究方向。针对基于排序学习的兴趣点推荐模型存在精度不高、推荐列表忽略兴趣点的位置等问题,提出一种基于ListMLE的兴趣点推荐算法。基于推荐列表中兴趣点位置的关注度差异,将改进ListMLE算法应用到兴趣点推荐中;用户社交关系影响融入ListMLE的打分函数;代价敏感方法融入推荐列表计算过程。实验表明,在真实数据集Gowalla上,算法的准确率和召回率均优于基线排序学习算法。  相似文献   

15.
针对WWW的HTML结构,采用TFE表示,给出一种新的TFE实现方法,在此基础上,探讨了基于向量空间模型的词元权重函数的构造方法,描述了权重函数,研究了先前比较典型权重函数,把整个文档作为一个空间,提出一种更有效的文本权重调整方法,试验结果表明,该算法对文本分类的准确率有明显提高。  相似文献   

16.
为提高组合检索系统的性能,提出一种基于混合模型的多搜索引擎融合方法.该方法利用高斯、指数密度函数分别描述相关、非相关文档的相关分值分布,用基于混合模型的算法规范化处理相关分值,估计非相关文档的相关分值,并进行分值合并.这样做既考虑到相关、非相关文档在分值分布上的差异,又考虑了用户对成员搜索引擎的性能评价.实验结果表明,利用该方法的平均查准率要比成员搜索引擎平均提高37.8%,也明显高于Sum-CombSUM、Sum-CombMNZ和Standard-CombSUM3种常用的融合方法。  相似文献   

17.
将深度学习应用于行人重识别领域,嵌入多尺度注意力融合模块至神经网络中进行多尺度特征提取和表示,可有效提升注意力机制对深度学习网络的识别性能。提出了一种基于SE block的多尺度通道注意力融合模块,并结合ResNet50卷积神经网络提取特征;然后通过双向LSTM网络进一步提取特征序列上下文信息,在提高模型对图像重要特征的提取能力的同时,降低对图像冗余特征的关注度;最后使用级联难采样三元组损失函数和交叉熵损失函数共同训练网络模型,使样本能够在高维特征空间中实现聚类,进一步提升模型识别准确性。所提出算法在Market1501数据集和CUHK03数据集分别进行实验,并在同等条件下和其他注意力模块算法进行比较。为进一步验证各模块作用,对算法进行消融实验,以验证各模块的有效性,实验结果表明,所提出方法可有效应用于行人重识别  相似文献   

18.
针对皮肤病中基底细胞癌与脂溢性角化病的临床特征非常相似、不易区分的问题,提出了一种面向皮肤病识别的多卷积神经网络(CNN)模型融合方法。使用迁移学习方法训练ResNet、Xception、DensNet共3个CNN模型,获得每个模型的最佳识别结果。在此基础上,利用传统融合方法、投票法和均方误差作为损失函数来融合多模型的识别结果,从而提高皮肤病的识别精度。为了有效克服皮肤病识别中噪声的影响以提高模型的精度和泛化能力,提出将最大相关熵准则(MCC)作为多CNN模型融合的目标函数,并使用梯度上升法学习不同模型对最终结果的贡献权重,从而建立基于MCC的多CNN融合模型。在基底细胞癌和脂溢性角化病数据集上的实验结果表明:相比于多个单模型的预测结果,提出的使用模型融合的方法取得了更高的识别准确率;相比于传统模型融合方法,提出的基于MCC的多CNN融合识别模型可以较好地克服噪声并具有较强的泛化能力,识别准确率达到了97.07%,超过了CNN单模型和传统的多模型融合方法。  相似文献   

19.
尽管卷积神经网络浅层特征可蕴含一些细节信息,但也包含大量噪声。对于宽裂缝,浅层信息则作用不大。因此,本文提出了一个基于VGG16骨架并融合深层特征的FCN分割网络,并在每层加入侧边输出以直接监督模型。此外,我们还采用了一种名为Focal Loss的损失函数来解决数据集本身正负样本分类不平衡的问题。这种多尺度多通道深层特征与独特的损失函数融合应用,使网络具备很强的抗干扰性和更快的收敛速度。在DeepCrack数据集上,本文提出的深层特征融合网络(Deep Feature Fusion Network,DFFN)与HED、FCN和DeepCrack相比,表现出更好的性能和更快的推理速度。  相似文献   

20.
船舶锅炉水位PID控制器参数多目标优化整定   总被引:1,自引:0,他引:1  
为有效提高船舶锅炉水位控制性能,提出一种基于多目标遗传算法和多属性决策(MADM)技术的PID控制器参数整定方法.将系统的跟随性能、扰动抑制性能及鲁棒性能作为目标函数,采用改进非劣分层多目标遗传算法(NSGAⅡ)求出Pareto最优解.使用客观赋权的信息熵法对Pareto最优解属性进行权值计算.采用逼近理想解的排序方法(TOPSIS)进行MADM研究,给出了Pareto最优解排序.仿真结果表明,该方法通用性好,PID性能良好,适合工程实际应用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号