共查询到18条相似文献,搜索用时 78 毫秒
1.
精确的癌症分类对于癌症的成功诊断和治疗是必不可少的.半监督维数约减算法在干净的数据集上表现得很好,然而当面临噪声时,当前的大部分算法所构造的邻域结构是拓扑不稳定的.为了克服这一问题,文中提出了一种基于随机子空间的半监督维数约减算法(RSSSDR),将随机子空间与半监督维数约减算法结合起来.在数据集的不同随机子空间上,该算法首先设计多个不同的子图,然后将这些子图联合起来构成一个混合图并在其上进行维数约减.该算法通过最小化局部重构误差来确定邻域图的边权值,在保持癌症数据集局部结构的同时能够保持其全局结构.在公共癌症数据集上的实验结果表明,RSSSDR算法具有较高的分类准确率和较好的参数鲁棒性. 相似文献
2.
《华中科技大学学报(自然科学版)》2016,(1):36-40
针对影像分类中少量标记样本问题,提出了基于模糊粗糙集的影像半监督分类算法.首先,通过模糊粗糙集对数据的粗糙性与模糊性进行建模,采用归一化的模糊互信息来度量特征与类别信息的相关性,并利用模糊上下近似度量样本的类别隶属度;然后,结合归一化的模糊互信息改进正则化框架下的特征评价方法,在谱图分析的半监督特征选择框架下实现特征优选;其次,结合近邻约束提高模糊上下近似预测样本类别的准确性,设计基于模糊粗糙集的约束自学习,选择信息量大的未标记样本更新训练样本集;最后,利用新的样本集训练分类器,完成影像分类任务.多组实验表明所提算法能够在少量标记样本的条件下有效提高影像的分类精度. 相似文献
3.
随着万维网的快速普及和发展,Web上出现了大量短文本,如科技文献摘要、微博和电子邮件等.短文本内容短小,相互联系,已标注数据获得困难,导致传统分类方法很难取得较高的分类精度.为了解决短文本分类问题,提出了一种基于半监督学习的迭代分类算法(SS-ICA).它使用较少的已标记数据,利用短文本间的关系进行迭代分类.通过与常用分类方法进行对比表明,在标注数据较少的情况下SS-ICA比其他分类器有更高的分类精度. 相似文献
4.
5.
提出了一种基于马尔可夫链的半监督分类方法.通过在马尔可夫链模型中引入奖励,将向量之间的距离与夹角自然地结合起来.利用吸收态的概念对马尔可夫链模型进行了瞬态分析.未知数据的扩散抑止了误差的传播.真实数据的实验结果表明,该方法是一种比较有效的半监督分类方法. 相似文献
6.
《河南大学学报(自然科学版)》2017,(4)
针对非平衡数据的半监督分类问题,提出了一种基于Biased-SVM的非平衡半监督分类算法.该方法首先利用初始的标记样本集训练处理不平衡数据的Biased-SVM模型,然后用训练好的Biased-SVM模型为未标记样本加上标签,再把新标记样本加入到初始标记样本集中,重新训练Biased-SVM模型,最后在测试集上进行测试.选取公共数据库里的一些数据集进行实验,首先在两类不平衡数据集上实验的结果表明,在标记样本所占比例为20%~80%时,所提方法能够在不降低数据集整体G-mean值的基础上,提高小类的F-value值并具有较高的稳定性;然后在多类不平衡数据集上实验的结果表明,在标记样本所占比例为20%~80%时,所提方法能够在不降低数据集整体的EG-mean值的基础上,提高小类识别率并具有较高的稳定性. 相似文献
7.
深度学习在网格分类中的应用越来越受到人们的关注,在网格分类任务中,通常使用交叉熵损失作为损失函数。文章提出一种利用数据的结构相似性和几何一致性的正则化损失,将其加入损失函数中进行优化,可有效提高网格的分类准确率。从实验结果的量化指标来看,提出的正则化损失对于网格半监督分类任务的准确率有很好的提升效果。 相似文献
8.
在传统的监督学习任务中,实体被认为是独立同分布的.然而,现实世界中实体之间通过复杂的方式相互关联.例如在超文本分类中,具有链接关系的页面之间高度相关.标准的分类方法是忽略实体之间的联系,对每个实体单独分类.本文将Markov逻辑网应用到超文本分类中,旨在改善这一问题.实验结果显示了采用Markov逻辑网模型要比采用K最邻近节点算法的分类效果好;同时将实体之间存在的联系用于学习和推理对于分类也有一定的贡献. 相似文献
9.
分类学习算法的研究是计算机科学的研究热点,超图上顶点的分类问题作为一般图顶点分类问题的推广,被广泛应用于各种计算模型。对基于核方法的半监督超图顶点分类算法进行理论分析,给出算法的收敛性分析和广义界估计值。 相似文献
10.
基于关键字的自动图片标注方法,可以更为有效地实现海量图片的管理和检索.然而由于"语义鸿沟"问题,传统的自动图片标注效果往往并不理想.因此,对不精确的标注结果进行优化就显得尤为重要.文中提出一种新颖的图片标注方法.首先,利用基于相关性模型的递进算法得到图片的初始标注结果.然后,利用一种半监督的学习模型,也即随机游动与重新启动算法对得到的初始标注结果进行优化,并选择一定数量的顶端标注作为图片最终的标注.通过在通用Corel图片数据库的实验表明,文中提出的方案可以有效地提高图片自动标注的性能. 相似文献
11.
生成式模型需要对复杂的联合概率密度建模,并估计较多的参数,为此,文中提出了一种基于最小熵正则化的半监督分类算法.该算法利用Havrda-Charvat's结构α-熵作为目标的正则项,并用拟牛顿法进行求解.该算法既是判别式的,又是直推式的,从而降低了对模型的依赖程度,同时可以方便地预测训练集之外的示例标记.在UCI数据库上的仿真实验结果表明,所提出的算法即使在有标记数据较少的情况下仍能获得较低的分类误差. 相似文献
12.
为提高分类准确率, 解决城市区域社会功能标签分类难的问题, 提出了一种基于不确定抽样选择策略的半监督城市土地功能分类方法。该算法从轨迹数据中提取城市区域的特征向量, 只需对少量区域进行标签, 根据不确定抽样的主动学习选择策略, 从未标注训练样本中选取具有较多信息的数据, 利用半监督学习算法进行标注, 得到新的标注训练样本添加到训练集, 反复迭代后得到分类结果。实验结果表明, 该方法对不同社会功能的城市区域分类准确率可达90. 2%, 与传统方法相比分类准确率高, 减少了大量标注工作, 在少数标签数据上仍有较好的分类效果。 相似文献
13.
14.
自组织网络随机游走模型的渐近节点分布 总被引:1,自引:1,他引:1
把随机游走移动模型的渐近节点分布作为研究对象,根据仿真区域的不同,分为两种情况加以分析.当模型工作在无边界区域的时候,应用中心极限定理求得节点经过n步移动后端点坐标的概率密度函数.当模型工作在有边界区域的时候,应用马尔可夫链理论和仿真实验证明,由于边界效应的存在,随机游走模型的渐近节点分布是均匀分布. 相似文献
15.
研究了特殊情况下平面上带有双侧吸收壁的随机行走模型,研究了母函数在这一随机行走模型中的应用,用母函数推导并证明了特殊情况下质点到达吸收壁的概率计算公式. 相似文献
16.
考虑独立随机变量的和Sn=X1 … Xn(S0=0),其中Xn,n≥2具有相同的分布F(x),x∈[-∞, ∞]及负的均值,X1具有分布G(x).在次指数型分布的条件下,我们得到了Sn的最大值分布的尾渐近估计。 相似文献
17.
李茂林 《北京大学学报(自然科学版)》2016,52(1):17-24
实体链接任务的目的是将文本中的实体指称链接到知识库中与之对应的无歧义实体。针对此任务, 提出一种基于主题敏感的重启随机游走的实体链接方法。该方法首先使用实体指称的背景文本信息将实体指称扩充为全称, 并在维基百科知识库中搜索候选实体, 得到候选实体集合; 根据上述中间结果构建图, 利用在图上的主题敏感重启随机游走得到的平稳分布对候选实体集合进行排序, 选出top 1 的候选实体作为目标实体。实验结果表明, 该方法在KBP2014 实体链接数据集上实验的F 值为0.623, 高于其他系统实验的F值, 能够有效提高实体链接系统的整体性能。 相似文献
18.
设{Xn,n≥0}为随机游动,令T0=0,Tj=min{n>Tj-1;Xn-xn-z>0},j≥1,本文在条件P(Tj<∞)=1下,讨论了派生链的常返性与正常返性。 相似文献