首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对社交图像的标签无序性问题,提出了一个新的标签排序方法.根据标签与图像内容的相关性,将社交图像的标签次序进行重排.基于图像显著性区域的视觉内容,用k近邻算法找到给定图像的视觉近邻,用近邻图像的标签列表对给定图像的标签进行投票学习每个标签的相关性,按相关性由高到低的次序对标签进行重新排列.与现有的方法相比,该文应用显著性模型找到与标签语义更加相关的图像近邻,增强了标签排序的准确性.实验结果表明,该文提出的方法得到的标签排序结果更加接近人工排序结果.  相似文献   

2.
基于排序学习的文本概念标注方法研究   总被引:1,自引:0,他引:1  
提出一种基于排序学习的方法CRM (concept ranking model), 来实现文档的维基百科概念自动标注。首先人工对一定规模的文档进行概念标注, 建立训练集合, 然后利用排序学习算法在多项特征上得到对概念排序的模型, 利用这个概念的排序模型对任意文档进行概念标注。实验表明, 相对于传统的文档概念标注方法, 此方法在各类指标上都有相当大的提高, 标注结果更加接近人类的概念标注。  相似文献   

3.
标签推荐系统是为目标用户推荐最可能用来标记某个资源的一系列标签.目前基于塔克分解模型,相比传统的FolkRank等算法具有更好的预测质量,但它本身的时间复杂度很高,很难适用于大中型数据集;而正则分解模型的时间复杂度虽然为线性,但预测质量并不高.针对上述问题,在改进塔克分解模型的基础上首先提出成对交互张量分解模型PITD.该模型仅考虑用户、资源和标签3个特征之间的部分两两交互关系,减少了无关信息对模型性能以及效率的影响.进而,利用贝叶斯个性化排序方法对PITD模型进行推导,并设计了相应的优化算法.最后,在真实数据集上的广泛实验表明,PITD模型比对比算法具有更好的推荐性能.  相似文献   

4.
提出一种基于视觉内容语义相关度的图像标签自动排序方法.该方法按照标签与图像内容的语义相关程度对网络共享图像的标签进行排序.首先,算法基于贝叶斯理论给出标签与图像内容语义相关度计算的概率表述.然后,融合多种视觉特征以实现对不同语义的标签与图像内容相关度概率的准确估计,具有较高的可扩展性.实验数据采用149 915幅Flickr网站下载图像,实验结果验证了本文方法的有效性.  相似文献   

5.
提出了一种新的静态黑盒测试用例优先级(Test Case Prioritization,TCP)排序算法,在没有源代码的情况下,需要对测试用例集合按照优先级进行排序。改进原始的LDA算法,应用每个测试用例的语言数据(如,标识符名称、注释和字符串文字)和标签来预测测试用例的主题,利用期望最大化算法进行模型的参数估计。在实验部分,我们将提出的算法与现有的技术进行比较,以验证该算法的性能。  相似文献   

6.
一种编辑距离算法及其在网页搜索中的应用   总被引:1,自引:0,他引:1  
针对传统方法不能很好地处理网页中简短域与用户查询之间的相关性排序问题,提出一种基于改进的编辑距离排序算法.将以词为单位的用户查询和简短网页域通过匹配编码转化为2个字符串,再利用改进的编辑距离计算2个字符串之间的相似性.由于在用户查询与待比较的简短网页域之间引入了查询词分布的位置、顺序和距离等,以及含有查询词修饰关系的重要信息,所以编码字符串之间的相似程度可以衡量对应的查询与简短网页域之间的相关性.经大规模真实搜索引擎实验表明,该算法较之传统的相关性排序算法,可以显著地提高网页搜索中的简短网页域相关性排序性能,尤其适用于简短域与用户查询之间的相关性比较.  相似文献   

7.
当对三支决策边界域进一步划分时,边界域知识存在划分信息不足,从而导致分类精度不高,针对上述问题提出一种新的基于三支决策的二阶段分类模型(TWD-TP).第一阶段根据贝叶斯规则构建三支决策中样本的条件概率,通过求解最优化损失函数得到所需阈值,然后按照三支决策规则对数据集进行划分.三支决策是基于最小风险贝叶斯决策理论的划分,在其正域、负域中包含一定的误分类样本;在第二阶段通过类标签索引分别将正域、负域中误分样本作为增量信息引入延迟决策域,形成重构边界域,最后对重构边界域进行划分.实验结果表明:所提出的TWD-TP模型不仅能在三支决策划分中筛选出高误分类特征的样本,同时其重构边界域中不能被划分的样本得到正确划分,分类精度进一步提高.  相似文献   

8.
提出一种基于实数域矩阵降维的稀疏贝叶斯跳频信号到达角(DOA)估计算法.该算法通过酉矩阵变换将复数域信号稀疏表示转换至实数域,利用奇异值分解对实数域数据矩阵进行降维,降低了计算复杂度;通过改进稀疏贝叶斯算法中预设阈值的比较方式和噪声方差初始值的设置方法,减少算法迭代次数.仿真结果表明:在低信噪比或低快拍数条件下,该算法DOA估计精度优于传统的稀疏贝叶斯学习算法,所需计算时间更少,且不受跳频信源相干性影响.  相似文献   

9.
一种词汇共现算法及共现词对检索系统排序的影响   总被引:6,自引:0,他引:6  
为了探讨共现词对检索系统排序相关性的影响,提出一种新的共现词汇算法--FDC.算法中考虑了词汇在文档中的共现频度、相对距离和共文档率.从天网搜索引擎查询日志中选取部分查询词,用本算法和潜在语义索引(LSI)方法分别求其共现词汇,并以相同的评分策略改变原始排序结果.Discounted cumulative gain(DCG)评估结果表明,本算法获得的共现词在99%的置信度下对原始排序的相关性有改进;而LSI方法获得的共现词对排序相关性也表现出同样显著的改进效果.结果显示共现词汇能改进检索系统结果排序的相关性,并且不依赖于特定算法.  相似文献   

10.
油藏预测中的贝叶斯网络融合方法   总被引:5,自引:1,他引:4  
针对油藏分布预测的问题,提出了一个贝叶斯网络融合模型并设计了相应的算法.数据预处理时,为消除对地质、测井、钻井等多个专业和领域的数据分类所产生的误差,采用了数据聚类分析中k-平均算法,并针对专业领域数据的特点对算法进行了扩充与优化.最后,融合中心将贝叶斯网络输出的客观概率知识与领域专家知识进行主观融合,得出结论.实验表明,这一方法解决了油藏问题研究中传统方法(单一神经元网络模型方法)设计困难,训练周期长、速度慢,分类结果不精确等缺点,可以满足油藏分布预测的要求.  相似文献   

11.
构建中医证素组合智能诊断模型需要特殊的域预测分类器而非传统的点预测分类器.引入一致性预测器(conformal predictor,CP),以算法随机性水平值为证素的重要性度量,以算法风险水平为阈值进行域预测输出,以中医慢性疲劳样本集为研究对象,随机森林(random forest,RF)等传统机器学习算法被嵌入到CP框架中计算样本奇异值.实验结果表明,CP-RF模型不仅拟合率比其他域预测分类器高,还对阈值具有很好的鲁棒性,克服了阈值对预测域的波动性,解决了中医多证素组合诊断关键的技术难题之一,同时CP-RF模型的预测域错误率能够被算法风险水平阈值所校准,表明其阈值具有明确的统计意义和可解释性,能够被中医医生所接受.  相似文献   

12.
多标签分类是一项重要且具有挑战性的任务,对于场景分类、信息检索和网页挖掘等领域有重要意义.近年来,研究者倾向于挖掘并利用标签相关性以及实例相关性来提升多标签分类的性能,其中利用这类相关性来解决多标签分类中的标签缺失问题一直是机器学习领域的热门研究点,但现有的方法都忽略了标签和实例之间的相关性.针对标签完整和标签缺失的情况,基于矩阵分解的方式分解得到实例和标签的特征表示矩阵,在利用标签相关性和实例相关性建立正则约束的同时,首次建立实例和标签特征表示间的相关性并用以建立正则约束,进而提升算法性能.在三个真实数据集上对提出的算法进行性能验证,实验结果表明,该算法和对比算法相比,获得了最高的预测精度.  相似文献   

13.
提出了一种融合标签局部相关性的标签分布学习(label distribution learning, LDL)算法,该算法分为3个阶段。初始预测阶段构建多层神经网络模型,将样本的原始特征作为输入、初始预测的标签分布作为输出;局部矫正阶段首先利用k-means聚类算法获得不同类所描述的局部信息,然后针对不同类计算对应的协方差矩阵,利用该矩阵来矫正初始预测的标签分布,获得每个类对应的矫正标签分布;标签融合阶段对矫正后的标签分布进行加权,再与初始预测的标签分布进行融合,得到最终的预测分布。在8个公开数据集上与9种常用的LDL算法进行对比实验,结果表明本文的算法能较好地描述标签局部相关性,在多个主流评估指标上排名靠前。  相似文献   

14.
为准确预测太阳辐射量,提高太阳能利用效率,提出一种相关性分析和梯度提升决策树(gradient boosting decision tree,简称GBDT)组合的太阳辐射量预测算法.利用相关性分析选取预测算法的最优输入指标,使用数据矫正方法剔除粗大误差数据.将该文算法与传统算法的预测结果进行比较,结果表明该文组合预测算法具有更高的预测精度.  相似文献   

15.
针对短时交通流量预测的难题,在传统贝叶斯组合模型进行改善的基础上,提出一种改进型贝叶斯组合模型.该模型只根据各基本预测模型当前时刻之前几个交通流量的预测表现,通过提出的分配算法实时更新组合模型中各个基本预测模型的权重,从而改善了传统贝叶斯组合模型权重计算迭代步长过长的缺陷,提高了贝叶斯组合模型对各个基本预测模型预测精度的灵敏性.通过对实地的交通流量的预测发现,基于改进型贝叶斯组合模型的预测精度不仅优于单一的预测方法,而且也优于传统的贝叶斯组合模型,从而证明了改进型贝叶斯组合模型有效提高预测的可靠性和具有一定的实用性.  相似文献   

16.
多标签分类问题已广泛应用于文本分类、图像分类、生物基因功能分类、视频语义注释等.相比较于单标签分类,多标签分类更符合真实世界的客观规律.然而,已有的卷积神经网络多标签分类算法没有探究标签之间相关性,为此提出了一种基于标签相关性卷积神经网络多标签分类,即计算标签之间共现相似度方法,同时为了解决卷积神经网络预测精度高,训练时间长的缺点,引入了迁移学习的方法加快了模型的训练时间.实验表明,提出的算法优于传统的多标签分类算法.  相似文献   

17.
针对标签特定特征多标签学习算法(multi-label learning with label-specific features, LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specific features via label correlations, LFLC).将标签空间加入特征空间进行聚类构建分类模型,采用考虑标签相关性的聚类集成技术为每个标签构造标签特定特征,使用相关性矩阵构建无向完全图并挖掘图中标签集合相关性,通过树集成表达标签间多种不同结构的强相关性.在试验部分,采用涵盖不同领域的10个数据集,以Hamming Loss、Ranking Loss、One-error、Coverage、Average Precision和macroAUC为评估指标,进行了参数敏感性分析和统计假设检验.结果表明:结合聚类集成与标签间强相关性的LFLC算法较其他对比多标签算法整体上能取得较好的效果.  相似文献   

18.
针对传统辐射源指纹识别过程中测试数据间的相关性往往被忽略,同时非合作条件下辐射源信号的识别训练标签数据不足的问题,提出了一种半监督条件下的贝叶斯估计辐射源指纹特征识别算法.首先,针对训练数据集不足的问题,在训练特征集提取阶段,利用半监督条件下的贝叶斯估计算法将有标签训练数据和无标签测试数据同时用于特征学习,以获取更为鲁棒的训练特征集.其次,为了有效利用测试数据之间的相关性,在测试特征集识别阶段,利用测试特征集与训练特征集的联合表征模型,将测试数据之间的相关性考虑在内,以提高识别算法的鲁棒性.实验结果表明:该算法在训练样本较少的情况下,依然可以获得较为鲁棒的分类识别效果.  相似文献   

19.
针对传统BP神经网络在深基坑施工开挖变形的预测,基坑的安全性判定仅利用监测的最终数值而无法全面服务于深基坑工程,提出了一种遗传算法(Genetic Algorithm, GA)和贝叶斯正则化算法(Bayesian Regularization, BR)组合优化传统BP神经网络的预测模型,在优化预测模型中加入了影响深基坑安全稳定的客观因素及人为主观因素,进一步提高了BP神经网络全局优化能力以及泛化能力.研究结果表明:该组合优化方法对深基坑地表沉降和水平位移变形预测的平均相对误差分别为0.32%和0.59%,表现出较高的预测精度.该组合优化模型首次在深基坑变形领域验证了应用的可行性,为深基坑变形预测提供了新的思路和方法.  相似文献   

20.
层次多标签分类方法,依据标签之间的相关性组织成层次结构,并将这种层次结构作为一种监督信息,从而更好地解决多标签分类问题.在层次多标签分类问题中常用的方法有两种,一种可称为损失无关方法,另一种可称为损失敏感方法.对于损失敏感方法,常用的损失函数有HMC-loss,该损失函数可对假正和假负两种错误给予不同的权重,并将层次信息添加到损失函数当中.当利用HMC-loss预测时,尽管得到的损失值是理想的,但实际预测的标签数却远多于真实的标签数.另外,层次信息的引入会对标签结点的决策顺序产生不利影响.针对这些问题,首先提出改进的损失函数IMH-loss,其次使用贝叶斯决策理论,提出了一种贝叶斯风险随决策过程可变的层次多标签分类方法.在真实数据集上的实验结果表明,该方法在保证召回率的同时,提升了标签预测精度.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号