首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 375 毫秒
1.
针对多示例多标记学习中标记间树结构的问题,将多示例学习、多标记学习和树结构标记优化方法有机融合,提出了基于树结构标记的层次性多示例多标记学习方法TreeMIML. TreeMIML先将样本中的多个示例转化为单示例,然后通过多标记学习得到新样本的标记,最后通过树结构标记优化方法学习样本的最终标记.实验结果证明,TreeMIML方法在G蛋白偶联受体的生物学功能预测上获得了很好的分类性能,优于目前最好的多示例多标记学习和多标记学习方法.  相似文献   

2.
文本分类中的主动多域学习   总被引:1,自引:0,他引:1  
现有主动学习主要着眼于对单个域训练方法的研究,不同域有不同的特征,同时也存在一些隐含的共性.如何从多个域中选择合适数据样本成为多域学习中减少人工标注工作量的关键.本文提出了一个新颖的主动多域学习框架,该框架充分考虑了重复信息,并可从多个域中选择合适的数据样本.该框架首先找到一个包含不同域间隐含共性的共享子空间,然后将所有数据样本分解为公共域部分和个性域部分,其中公共域部分可视为域间的重复信息,该部分在查询时需要被考虑到.最后,将主动多域学习方法与最新的主动学习方法的性能进行了比对,实验结果表明,本文提出的主动多域学习方法在减少人工标注工作量方面有显著作用.  相似文献   

3.
基于主动学习SVM分类器的视频分类   总被引:4,自引:0,他引:4  
提出一种基于主动学习SVM分类器的视频分类算法.该算法分为两个步骤:首先分析并提取与视频类型有关的十维底层视觉特征;然后用SVM分类器建立这些底层特征与视频类型之间的联系.在获取SVM分类器所需的训练样本时,采用主动学习的方法选择对SVM分类器最"有用"的样本提供给用户进行标注,用更少的训练样本获得与大量训练样本近似的分类效果,从而减轻用户标注负担.针对多类SVM分类的主动学习问题,提出用后验概率计算分类器对未标注样本的置信度进行样本选择.实验结果表明,主动学习算法与随机采样标注的被动学习算法相比,在相同的训练样本情况下能够获得更高的分类精度;而基于后验概率选择样本的主动学习要略好于传统的基于变型空间(version space)选择样本的主动学习.  相似文献   

4.
将基于多示例学习的相关反馈技术应用到遥感图像检索中.为了避免局部最小值和减少冗余计算量,对传统的多示例学习算法--多样密度算法进行了改进.改进的算法利用用户标注的样本学习得到的查询概念,指导下一轮检索.为了提高查准率,综合学习得到的查询概念,提出了查询概念集来取代查询概念.实验结果表明,该算法比传统方法具有更好的检索性能.  相似文献   

5.
针对主动学习面向大型数据集人工标记成本过高和半监督自训练算法中存在误标记点影响的问题,提出了一种主动学习与半监督自训练交替迭代训练的联合算法.算法在训练过程中奇数轮次采用主动学习算法,偶数轮次采用自训练算法,通过2种算法的交替迭代训练以弥补彼此不足.自训练算法对无标记样本的预测减轻了主动学习标记样本的负担,同时主动学习标记易变成噪声的样本,减轻了自训练算法训练过程中对样本的标记错误.提出了一种基于密度峰值聚类和隶属度的改进主动学习算法:将初始无标记样本聚类成簇,根据隶属度差值在每个簇内选取部分样本做人工标记,获得可表达样本的整体结构的均衡样本.仿真试验表明:提出的联合算法在性能上要优于2种单一算法.对比常见的主动学习算法,改进后的主动学习算法分类性能得到显著提升,将其应用于联合算法中的效果更具优势.   相似文献   

6.
多示例多标记学习在多语义对象处理中克服了多示例学习和多标记学习的缺点,成功应用于文本分类、图像识别标注、基因数据分析等任务中.其中基于退化策略的多示例多标记学习算法,多利用K-Medoids聚类将多示例多标记退化成单示例多标记,但此种退化方式过于简化多语义和复杂语义的对象,并未考虑示例间的相关性,导致退化过程中的信息削弱甚至丢失.针对这一问题,提出了结合均值漂移的多示例多标记学习改进算法(MultiInstance Multi-Label with Mean Shift,MIMLMS),将高斯核函数和权值加入均值漂移中.权值的加入保证了示例之间的相关性得以保留,而将多示例集合加入高斯核函数就可利用核密度估计和梯度下降法求解退化过程最优解,最终以误差平方和为分类目标函数,建立多示例多标记分类模型.算法在基准的多示例多标记测试数据集中的实验结果,验证了算法的良好分类效果及算法的有效性和可靠性.  相似文献   

7.
一种新的基于多示例学习的场景分类方法   总被引:1,自引:0,他引:1  
多示例学习是近年来才出现的一种新的学习框架,并以其对多义性对象的出色表示能力而被成功地运用在图像分类任务中。首先提出了一种新的图像多示例包生成方式,采用特征的概率分布表示图像,并对图像像素分布提取一个高斯混合模型,将每个高斯分布作为一个示例,生成图像的多示例包。然后,在对图像进行分类时,采用了信息瓶颈聚类把多示例包转化成单示例,从而将传统的单示例分类器用在该问题上。为了提高分类器的泛化能力,对多个分类器进行了集成。选取了5类自然场景图像进行试验,结果显示所提出的方法平均性能优于当前常用的一些多示例学习算法。  相似文献   

8.
多示例学习(Multi-Instance Learning,MIL)研究对象的内部结构比单示例学习更加复杂.已有的MIL方法大都基于原始空间中的实例进行包映射,但这些方法通常忽略包的内部结构信息,难以保证所选实例与包在新特征空间中的关联性.提出一种多示例学习的两阶段实例选择和自适应包映射(TAMI)算法.首先,实例选择...  相似文献   

9.
以多示例学习(Multiple Instance Learning,MIL)目标跟踪方法为代表,基于自适应辨别模型的视频目标跟踪算法近年来得到广泛重视,这些算法用分类器对图像进行处理,将使分类器置信最大的采样样本作为当前帧的跟踪结果.在此基础上,基于加权多示例学习(Weighted Multiple Instance Learning,WMIL)的目标跟踪算法提出在分类器学习阶段对正样本进行重要性采样,加大正包内正样本的贡献,达到更好的跟踪效果.然而,当前一帧输出结果不准确时,会使得分类器学习性能下降,从而引起目标漂移或跟踪失败.本文基于WMIL算法,提出用目标匹配约束预判断当前帧是否存在目标漂移,从而对下一帧采样中心位置进行矫正,达到抑制目标漂移以及避免跟踪失败的效果.仿真结果表明,本算法在标准视频测试集上都取得了较优的结果.  相似文献   

10.
针对基于对象的图像检索问题,提出一种新的谱聚类多示例学习算法.该算法将图像当作包,将分割区域的视觉特征当作包中的示例,针对正包示例集合进行谱聚类,按聚类中心点数最大原则选择潜在正示例中心和潜在正示例代表,并采用径向基函数和金字塔核分别度量潜在正示例间和其它示例间的相似性,最后利用支持向量机和相关反馈实现图像检索.采用S...  相似文献   

11.
潘强  张钢  王春茹 《科学技术与工程》2012,12(30):7931-7936
提出了一种考虑包中样本在概念空间中重要度的多示例核学习方法。引入了包中示例对整个样本空间所包含概念的权重向量。通过数量化的手段表示出每个示例从属于每个概念的重要程度。主要步骤如下:a)通过对所有示例进行聚类,得到能够反映多示例包中所含概念的簇;b)借用文本分类中的r-pattern计算得到每个示例对于概念空间中每个概念的权重向量;c)在多示例核中通过余弦相似度结合示例的权重,得到更能反映概念空间特性的多示例概念核。该方法同时考虑了包层次的概念和示例层次的权重,能够有效度量包中示例对于最终包标记的影响,且本身建立在多示例核的基础上,适用于多种多示例学习的场合。在标准数据集和图像数据集上的实验表明,该算法是有效的。  相似文献   

12.
使用机器学习算法对建筑能耗进行预测正逐渐成为建筑设计初期重要的决策辅助工具,机器学习算法的选择及其参数设置一直是机器学习领域研究的热点和难点。但现有研究大多从算法原理角度进行预测模型的选择及参数设置,训练样本集的特征信息未得到充分利用。为此,提出一种以样本量及样本分布特征为出发点的样本集质量分类方法,针对不同质量样本集测试不同机器学习算法的学习性能,制定不同质量样本集的算法选择及参数设置策略。分析样本特征与算法性能之间的关系,为建筑设计提供有效指导。  相似文献   

13.
针对主动学习由于初始阶段随机选择样本而导致的抽样偏差,将Sanjoy Dasgupta等人提出的分层聚类采样(Hierarchical sampling,HS)引入到主动学习方法中,替代初始阶段随机样本选择,然后在基于支持向量机分类器的图像算法中引入最优标号和次优标号(Best vs second-best,BvSB)的反馈准则,提出了基于HS和BvSB(HS+BvSB)的多类图像分类方法。分别在两组标准测试数据集上进行分类实验,比较HS+BvSB方法与随机选择样本+BvSB方法的学习性能,结果表明,随着初始选择样本数目的增多,提出的Hs+BvSB方法具有更优的性能。  相似文献   

14.
Multiple-Instance Learning (MIL) is used to predict the unlabeled bags' label by learning the labeled positive training bags and negative training bags.Each bag is made up of several unlabeled instances.A bag is labeled positive if at least one of its instances is positive,otherwise negative.Existing multiple-instance learning methods with instance selection ignore the representative degree of the selected instances.For example,if an instance has many similar instances with the same label around it,the instance should be more representative than others.Based on this idea,in this paper,a multiple-instance learning with instance selection via constructive covering algorithm (MilCa) is proposed.In MilCa,we firstly use maximal Hausdorff to select some initial positive instances from positive bags,then use a Constructive Covering Algorithm (CCA) to restructure the structure of the original instances of negative bags.Then an inverse testing process is employed to exclude the false positive instances from positive bags and to select the high representative degree instances ordered by the number of covered instances from training bags.Finally,a similarity measure function is used to convert the training bag into a single sample and CCA is again used to classification for the converted samples.Experimental results on synthetic data and standard benchmark datasets demonstrate that MilCa can decrease the number of the selected instances and it is competitive with the state-of-the-art MIL algorithms.  相似文献   

15.
为解决把多示例学习应用到目标跟踪算法而导致的误差积累问题, 结合协同训练方法, 提出一种新的目标跟踪算法。该算法利用协同训练克服分类器自训练带来的误差积累, 同时在线多示例学习提高了跟踪效果的鲁棒性。将跟踪结果中心与理想目标位置中心的误差作为评价标准, 在标准视频序列上将跟踪结果与半监督学习跟踪算法和传统多示例学习跟踪算法进行对比。实验结果表明, 该方法在背景光照变化、目标旋转等复杂条件下, 可很好地跟踪目标, 具有较好的鲁棒性。  相似文献   

16.
针对当前主动学习策略直接用于支持向量机(SVM)分类器时存在泛化能力不强的问题,提出了两层主动学习策略(TLAC),该策略利用协调训练的思想,深层挖掘未标记样本数据的分布知识,从而选择最有利于分类器性能的样本来训练分类器.实验表明,该TLAC策略能够合理地指定TSVM算法中的正样本数,在典型指标测试中都表现出了一定的优越性.  相似文献   

17.
研究了离散不确定系统的滑模输出反馈控制问题.考虑离散系统的不确定为非匹配不确定,且具有未知的范数界,通过设计死区自适应律,实现了对此不确定界的在线辨识.在此设计的基础上,基于快速输出采样(multirate output sampling)原理,对系统设计了具有不确定自适应的滑模输出反馈控制器,在所设计的控制器作用下系统渐近稳定.快速输出采样是通过设置输出采样频率大于输入采样频率,经过相应的运算得到系统的当前状态信息与系统前一时刻输入信息和当前输出信息具有一定的函数关系.最后通过数值仿真验证了所设计控制器的有效性.  相似文献   

18.
主动学习是机器学习领域的重要研究方向.现有主动学习方法通常选择不确定性的或具有代表性的样本供专家打标,然后添加到已标记的数据集中供分类器学习,但没能充分利用数据的分布信息,并且在野点采集问题上有待改进.结合邻域粗糙集理论,提出了一种基于邻域粗糙集的主动学习方法(neighhbor rough set active learn-ing,NRS-AL).实验结果表明,在加州大学数据集(university of CaliforniaIrvine,UCI)上,该算法充分利用了数据的分布信息,同时结合样本的不确定性和代表性计算,处理了野点的选择,是一种能有效解决主动学习样本选择问题的算法,在accuracy,受试者工作特征(receiver operating characteristic curve,ROC)曲线下面的面积(area under curve,AUC)指标上优于文献中的主动学习算法.  相似文献   

19.
针对基于检测目标跟踪中的特征描述子Haar-like表征能力不强和易引入错误训练样本导致目标漂移的问题,提出了一种利用分布域描述算子进行示例层级的在线判别特征选择跟踪算法.首先,用软直方图方法快速近似得到分布域特征,并利用此描述算子取代Haar-like特征有效表示目标的外观信息.然后,基于示例级样本的先验信息进行有监督学习,利用在线判别特征选择算法选择最佳的分布域层特征以减少漂移现象发生.实验利用多场景视频标准测试库及新的评价指标进行验证,结果表明本文算法性能优于对比算法.  相似文献   

20.
针对传统转换多标记学习算法较难确定最低阈值的问题,该文对传统转换策略的多标记学习算法进行改进,提出了一种基于最低阈值的学习算法(TFEL),该方法根据类别标记学习为每个类别得到一个最低阈值.当分类器将一个测试示例预测为某个类别标记的分值大于为该类别标记学得的最低阈值时,则将该类别标记添加到该测试示例的最终分类结果中.实验结果表明, TFEL方法能够得到较好的分类效果,证明了该方法的可行性和有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号