首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
多标记学习广泛应用于图像分类、疾病诊断等领域,然而特征的高维性给多标记分类算法带来时间负担、过拟合和性能低等问题.基于多粒度邻域一致性设计相应的多标记特征选择算法:首先利用标记空间和特征空间邻域一致性来粒化所有样本,并基于多粒度邻域一致性观点定义新的多标记邻域信息熵和多标记邻域互信息;其次,基于邻域互信息构建一个评价候...  相似文献   

2.
传统的Relief-F算法主要用于处理有标记数据集.针对部分标记数据集,引入一种基于耦合学习的数据样本相似度,设计了一种面向符号数据的基于Relief-F算法的半监督特征选择算法.为有效验证新算法的可行性,实验分析中选取了5组UCI数据集和3种常用机器学习分类器来进行验证,实验结果进一步验证了算法的有效性.  相似文献   

3.
数据规模的不断增加,使得为数据库中全部样本做标记变得尤为困难,数据集也因此呈现出了明显的弱标记性.为此,针对大规模少数标记数据集的特征选择问题,基于经典的Relief-F算法,通过综合考虑有标记样本与无标记样本对数据样本近邻的影响,重新定义样本近邻的搜索策略,提出了一种面向符号数据的半监督特征选择算法.为进一步分析新算法的有效性,仿真实验中选取了5组UCI数据集,并引入机器学习中3个常用分类器对新算法和对比算法的特征选择结果的分类性能作了分析和比较,实验结果很好地验证了本文中提出的新算法的有效性和可行性.  相似文献   

4.
针对影像分类中少量标记样本问题,提出了基于模糊粗糙集的影像半监督分类算法.首先,通过模糊粗糙集对数据的粗糙性与模糊性进行建模,采用归一化的模糊互信息来度量特征与类别信息的相关性,并利用模糊上下近似度量样本的类别隶属度;然后,结合归一化的模糊互信息改进正则化框架下的特征评价方法,在谱图分析的半监督特征选择框架下实现特征优选;其次,结合近邻约束提高模糊上下近似预测样本类别的准确性,设计基于模糊粗糙集的约束自学习,选择信息量大的未标记样本更新训练样本集;最后,利用新的样本集训练分类器,完成影像分类任务.多组实验表明所提算法能够在少量标记样本的条件下有效提高影像的分类精度.  相似文献   

5.
针对Laplacian分值法进行特征选择时过分依赖样本局部结构信息的不足,提出一种改进的基于约束Laplacian分值的半监督特征选择算法。该算法利用样本之间的cannot-link成对约束关系作为全局结构信息,在进行特征选择时,不仅能尽量保持局部结构信息,而且还尽量保持了全局的cannot-link约束关系。基于Yale和PIE(Fave pose,Illamination,Expression dadbase)人脸数据库的实验表明,该算法性能显著优于Laplacian分值法,与Fisher分值法和最新的约束分值法相当,且在稳定性方面优于后者。  相似文献   

6.
专家可为社区问答提供权威的答复,高效精准的专家发现有助于提升问答社区的服务质量.现有社区用户数据中存在噪声标签数据,且由于专家数量较少造成分类数据不平衡,从而降低了监督学习模型的专家发现精度.针对上述问题,本文提出一种基于特征扰动的半监督专家发现方法.该方法构建了一种无标签数据特征扰动策略,利用Sharpening算法实现无标签数据的伪标签化;基于ADASYN算法,通过构建专家用户邻近样本的方式扩充专家样本数据量,缓解分类数据的不平衡;构建联合损失函数,利用有标签和伪标签数据共同训练分类器,增强模型的泛化性能.实验结果表明,该方法在多个评价指标上优于已有模型和方法.  相似文献   

7.
【目的】医学图像分割是医学图像分析中的一个重要内容。现有的大部分图像分割算法都是基于监督学习,而实际应用中医学图像标签难以获取,大量标注需依赖领域专家,费时费力。因此,提出一种双任务一致性的半监督医学图像分割模型。【方法】该模型采用一个编码器,两个解码器的网络结构,其中编码器和一个解码器实现图像分割,与另一个解码器实现图像重建。无标签数据通过一致性分割与重建任务得到的两个不同图像背景计算损失并优化网络参数。同时在网络的编码器部分加入注意力模块以更好地获取分割区域的空间位置信息,并使用锐化操作增加无标签数据重建输出的置信度。【结果】在肝脏和细胞数据集上IOU分别为0.953 6和0.821 0,相较于U Net提高了1.5%和4.82%;在眼底血管数据集上,SP值为0.983 0,与第二名相比提升了0.18%。【结论】本文模型与有监督方法和半监督方法相比,在医学图像分割的有效性和泛化性上有一定的性能提升,能有效解决数据集数量少、小病灶分割难度大的问题。  相似文献   

8.
在一致性正则化与熵最小化的基础上提出一种新的半监督学习算法Mean Mixup,集成数据的互补信息,然后使用熵最小化给未标记数据生成可靠的伪标签,在一致性正则化下进一步优化模型分类结果.在常用数据集SVHN和CIFAR10上对Mean Mixup算法进行了评估,实验结果表明,所提出的方法在分类准确率上优于一些已有的半监...  相似文献   

9.
传统的肿瘤基因选择算法挑选出的特征基因中存在大量噪声基因和冗余基因,从而对基因算法的准确性和分类精度产生影响.针对这一问题,将K-S检验与邻域粗糙集融合成为一种新的特征选择方法.首先,采用累积分布函数计算正负类样本的累积函数值和K-S检验统计量,对照显著性水平下的样本统计量,从而去除冗余基因和噪声基因;然后,使用邻域粗糙集进行约简,对比条件属性重要度得出最优约简结果;最后,对比K-S检验和两种基于K-S检验的特征选择方法得到的冗余度和分类精度,通过实验验证这种方法不仅能准确挑选出具有显著区分能力的肿瘤基因,且效率高具有可行性.  相似文献   

10.
为降低不完备决策表求核算法的时间复杂度,本文构造了粒度二进制的差别矩阵.然后定义属性重要性及相应的核,由此设计了一个基于不完备决策表的粒度二进制差别矩阵的求核算法,并分析新算法的时间复杂度,其时间复杂度降为max{O(|C||U||Upos|),O(K|C||U|)},优于同类算法的时间复杂度,最后用实例说明了该算法的有效性.  相似文献   

11.
针对目前决策表属性约简的计算问题,研究了粗糙集理论中差别矩阵,讨论了知识粒度与信息量、类别特征矩阵之间的关系,利用知识粒度最大的属性生成较小的类别特征矩阵,设计了新的启发式规则来快速缩小搜索空间和最小化属性选择,提出了一个基于知识粒度的最小属性约简算法,并用一个实例证明了算法的正确性。与类别特征矩阵相比,采用知识粒度生成的类别特征矩阵可以有效地减少存储空间。实验结果表明,所提出的算法能够得到最小属性约简。  相似文献   

12.
特征选择是从与应用有关的特征集合中选取出满足需要的重要性高的最小特征子集的过程,是入侵检测中的一项重要工作.针对现有的入侵检测系统存在的先验知识较少的问题,利用粗糙集中的知识表达系统来描述入侵检测特征集合,并通过计算各个特征的信息熵来确定其相对重要性,最终选择出精简的特征集合,简化了入侵检测训练集合,减少了检测时间并可以有效的提高入侵分类的准确性.  相似文献   

13.
针对高维数据中的特征选择问题,提出一种有监督的特征选择方法。首先基于非线性相关度量标准作为对离散型特征进行选择,先后做选相关、去冗余两种相关分析,并采用向前方式搜索,最后用邻近算法作为分类器对所选择的特征进行实验。结果表明,该方法能选出有用的特征来提高分类准确率,并降低数据的维度。  相似文献   

14.
孙花 《科技信息》2006,(11):303-304
特征选择是数据挖掘过程中的重要环节。RoughSet是一种新的处理不精确、不完全与不相容知识的数学理论[1],近年来该理论在机器学习、数据挖掘及模式识别等多个领域得到了广泛的应用[2,3]。特征选择为粗糙集理论研究的重要内容。特征选择即属性约简问题被证明为一个NP问题,前人在属性约简问题上做了大量工作。  相似文献   

15.
根据排序问题的单调先验知识,无监督学习问题中的观测属性之间也具备单调关系;否则该属性与排序无关,为冗余属性.基于排序互信息反应的两属性之间的单调关系,提出用每个属性与其他属性之间的平均互信息,来衡量每个属性与排序学习的相关程度,具有最高的平均互信息即为排序最相关的属性.  相似文献   

16.
基于粗糙集理论的目标特征选择方法   总被引:1,自引:0,他引:1  
基于粗糙集理论中的分辨矩阵提出一种新的特征选择方法.此方法的基本思想是:对目标分类最有效的特征应该能划分最多的不同类样本.将该选择方法用于人造数据和实际数据的特征选择中.结果表明:该方法能正确选择人造数据中的相关特征,且能大幅度降低实际数据的特征数目.使用该方法对水下目标的识别特征进行选择时,可将识别特征数目下降至原特征数目的20%左右,对特征选择后的数据进行分类时,正确率可提高约6个百分点.  相似文献   

17.
为了解决透明计算系统中的数据不一致问题,提出一种基于块粒度的数据一致性方法。该方法按需为每个用户创建独立的私有虚拟映像,将用户对系统虚拟映像的修改透明地转换为对用户私有映像的修改,并记录系统虚拟映像中被修改的数据和用户私有映像中相应数据的对应关系,保证每个用户能够访问各自最新的数据,从而解决了上述数据不一致问题。性能测试表明,采用该方法的透明计算系统性能优于同等配置的PC和其他类似系统,可以满足透明计算的需求。  相似文献   

18.
针对群决策中基于不同粒度语言判断矩阵形式偏好信息的群体一致性判断和改进问题,提出了一种新的分析方法.首先,根据专家给出的不同粒度语言判断矩阵,采用LOWA集结算子确定个体方案排序的序关系值向量;然后,以群体与专家个体意见偏差最小为目标建立目标规划模型,通过求解该模型得到群体方案排序的序关系值向量;进一步地,通过定义专家个体与群体意见的贴近度指标,给出了专家群体一致性的判别改进方法;最后,通过算例说明方法的可行性和有效性.  相似文献   

19.
特征选择技术是数据降维的一种关键技术,由于采集到的数据样本标签信息缺失,无监督特征选择受到了更多人的关注.现有的无监督特征选择算法普适性及稳定性很低,受数据集结构的影响很大,因此很多研究者一直热衷于提高算法的稳定性.该文尝试从数据集的预处理出发,采用区间的方式来对数据集进行近似,得到与数据集相关联的几个数据集,通过实验...  相似文献   

20.
半监督分类方法通过提取无标签样本的信息,结合有限的有标签样本,克服了高光谱图像准确地物标签样本不足的问题,有效提高了图像的分类精度.局部全局一致性算法是一种基于图的标签传递半监督分类方法,具有性能良好,易于求解以及能够有效反映所有样本间关系的优点,但是其分类结果极不稳定,不利于实际应用.支持向量机是高光谱图像的分类领域...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号