首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
通过海洋浮游生物图像对浮游生物进行识别和分类,有助于合理地开发、管理、利用海洋资源。针对直接使用PCA或ICA形成的特征空间,不能达到各类别元素未能较好分离的问题,提出了一种浮游生物识别算法。采用PCA和ICA相结合的多层混合分类模型,提取WHOI数据集浮游生物样本特征,放入到分类模型中进行测试,并对不同距离度量的识别效果进行了比较。结果表明基于耦合度量的混合分类模型具有良好的分类性能。  相似文献   

2.
一种基于关联规则的核粒度支持向量机   总被引:1,自引:0,他引:1  
提出一种基于关联规则的核粒度支持向量机(association rules based kernel granular SVM,AR-KGSVM)学习算法.AR-KGSVM首先将输入空间中的样本用核函数映射到高维特征空间,然后在核特征空间挖掘基于距离度量的关联规则以划分粒.算法的粒划分和数据训练都是在高维核空间中进行,避免了一般的粒度支持向量(granular SVM,GSVM)在低维空间作粒划分而在高维空间中训练,使数据分布不一致而导致泛化能力不高的问题.在标准数据集上的实验结果表明AR-KGSVM的泛化能力优于传统的SVM和GSVM方法.  相似文献   

3.
为提高短文本语义相似性度量准确性,设计一种基于混合机器学习模型的短文本语义相似性度量算法.先对短文本实施预处理,基于混合机器学习模型构建短文本的字词向量模型,对短文本进行特征扩展;然后组合短文本的多样度量特征,对多样度量特征进行维度规约;最后通过构建一个集成学习模型,计算语义相似性结果,实现语义相似性的度量.使用“Quora Question Pairs”比赛数据集测试该方法的性能,测试结果表明,该方法的准确性较高,对数损失和度量均方差均较低,说明该方法的相似性度量准确性较高.  相似文献   

4.
在机器学习中,特征选择是降低高维问题复杂性的有效方式之一。大多数特征选择算法是通过设计重要特征度量方法来提出备选特征序列,再根据序列选择特征子集。在此基础上,产生了划分特征子集作为独立空间学习的特征选择方法。然而,现有的空间划分机制多是人为切割原始特征空间得到的,鲜有人考虑因度量结果差异性导致的特征层次化现象,并以此划分空间。基于此,本文利用模糊互信息和有向无环图设计了一个分层模型,并提出了基于信息适应性分层粒化的多标签特征选择算法。同时,将获取的特征子集在标准多标签数据集上与多个先进算法进行对比实验,结果证明了本文算法的有效性。  相似文献   

5.
度量学习是机器学习中的重要研究问题之一,针对实际应用中的噪声数据,如何建立一个鲁棒的度量仍是一个挑战.本文将稀疏表示、特征学习与分类模型相结合提出了一种新的基于鲁棒回归度量学习(RRML)的算法并将其应用于图像分类.算法对最优特征子空间和稀疏表示进行联合学习,在更具判别性的低维表征空间中,通过稀疏表示有效地编码数据的局部结构信息,进而更好地揭示数据的内在鉴别信息,并以此指导该模型学习到最优的投影矩阵;同时对噪声矩阵和投影矩阵的行稀疏约束,可以极大降低噪声的影响.实验结果表明所提算法在图像分类准确率和鲁棒性方面均优于其他对比算法.  相似文献   

6.
基于地图代数障碍距离变换的空间引力模型研究   总被引:1,自引:0,他引:1  
空间引力模型是相互作用理论的重要组成部分,主要用于空间影响范围的划分.在全面评述现有研究成果的基础上,提出了基于地图代数障碍距离变换的空间引力模型研究的新思想.该方法利用空间引力模型判断各个城镇的吸引力,并应用基于地图代数障碍距离变换的度量方式求解距离参数,从而界定区域的城镇空间影响范围,并将结果与Voronoi图方法相比较.理论和实践证明,该方法可以更好地刻画城镇的空间吸引特征.最后,对将来的研究方向进行了展望.  相似文献   

7.
零样本学习是一类特殊的图像分类问题,是指测试数据的类别在训练数据中没有出现的情况.为了更好地描述语义特征空间中图像特征和语义特征的距离关系,本文将距离度量学习引入零样本学习任务.具体而言,首先利用典型相关分析将样本的图像特征和相应类别的语义特征映射至公共特征空间;然后,利用距离度量学习衡量图像特征和语义特征之间的距离;最后,使用最近邻分类器进行分类.通过在流行的Aw A和CUB数据集中的实验,证明了所提方法的有效性和鲁棒性.  相似文献   

8.
基于特征向量子空间距离的MPC控制器性能诊断   总被引:1,自引:0,他引:1  
针对当前MPC控制器性能评价方法无法定位性能下降源的问题,提出一种基于子空间距离聚类的控制器性能诊断新方法.新方法引入特征向量子空间描述各性能类别的特征,建立子空间距离来度量当前实时数据和已知类别数据的相似性,以距离为度量函数确定监控数据对应的类别,定位引起MPC控制器性能下降的原因.在Wood.Berry塔上的仿真结果验证了新方法的有效性.  相似文献   

9.
针对局部线性嵌入算法使用欧氏距离计算非对齐样本相似性时, 受数据位置差影响较大, 导致度量精度较低, 影响算法特征提取精度的问题, 提出一种基于信息熵度量的局部线性嵌入算法. 首先利用信息熵统计样本特征间的混乱程度, 提高划分局部邻域的准确性; 然后建立局部重构模型, 挖掘出流形的本质结构; 最后利用局部结构构建低维重构模型, 以获得样本的显著特征. 通过在轴承数据集上的实验证明了该算法在特征提取方面的有效性.  相似文献   

10.
针对t-相近性模型实现方法信息损失大和算法执行代价高的问题,提出一种基于敏感等级划分的(l,t)-相近性模型.该模型放宽了t-相近性模型对等价类的约束,要求等价类中敏感等级的分布与数据集中敏感等级的分布间距离不大于阈值t,并使用Hellinger距离度量敏感等级分布间的距离,以避免传统EMD距离须人工设定基准距离、计算量高的问题;同时,提出了一种基于聚类的(l,t)-相近性匿名算法((l,t)-CCA),使用敏感值的自信息来度量敏感度以实现敏感属性的等级划分,并以聚类的思想形成等价类来实现(l,t)-相近性模型.实验结果表明:该算法不仅能够抵御相似性攻击,而且信息损失低,时间开销少,能够更加有效地实现数据发布中数据的可用性与隐私安全间的平衡.  相似文献   

11.
基于支持向量域描述的多故障诊断动态模型   总被引:2,自引:0,他引:2  
为了提高多故障诊断中对新故障类别和新故障数据的适应性,提出了一种新的多故障诊断动态模型.该模型采用支持向量域描述算法(SVDD)对多类故障进行单独训练,建立独立而封闭的特征空间,满足故障类别的动态增加需要,并采用样本与各特征空间的相对距离进行了多故障的混合识别.应用在线SVDD算法,在已有的故障特征分布信息基础上,通过更新操作,学习新数据信息,从而实现了故障模式的动态调整.通过仿真和机械故障实例数据的检验,表明该模型能够动态地提取多类故障的特征信息,改善诊断学习过程的适应性.  相似文献   

12.
提出一种新的基于“局部字袋混合模型”表示的三维部分形状检索方法。该方法首先定义一种支撑范围相互重叠的三维局部字袋模型表示, 并在该形状表示下, 给出“推土机距离”的基础距离度量的定义, 并运用“层次匹配核”方法计算三维模型间部分相似性的具体步骤, 显著提高了原方法的效率和鲁棒性。在理论上证明了所提出的距离度量改进了整体字袋模型低估三维形状之间距离的问题。实验结果显示了该方法对三维部分形状检索的有效性。  相似文献   

13.
针对特征选择过程中特征评价指标单一性的问题,基于集成学习中的极端梯度提升算法,提出一种新的特征选择算法.该算法首先应用极端梯度提升算法中构建集成树模型的指标作为特征选择的特征重要性度量指标,然后利用一种新的双向搜索策略,权衡了多种特征重要性对结果的影响,并优化了评价过程的效率.通过11个不同维度的标准数据集进行测试,实...  相似文献   

14.
提出利用多图像组信息构建二部学习框架进行人脸识别。首先,利用两种不同的多图像组信息源分别学习两个相应的度量空间模型;其次,将得到的模型合并为一个统一的判别距离度量空间;最后,对所构建的二部学习框架进行范化,使得框架中的多图像组信息能够用来进行子空间学习和距离度量学习。通过在多个标准通用数据集上得到实验结果验证了所提出方法的有效性。  相似文献   

15.
针对权重粗糙集模型不能有效处理非平衡混合数据的问题,对权重论域上的各种类型变量进行分析并建立统一的模糊等价关系,提出混合数据上的权重模糊粗糙集模型,并利用该模型构造出带权模糊等价空间上的混合属性约简算法.混合属性约简算法产生的模糊软划分可以克服权重论域上离散硬划分产生的信息损失.在非平衡混合数据集上进行的实验结果表明,与基于权重粗糙集的算法相比,基于权重模糊粗糙集模型的属性约简算法的平均分类精度提高了11.9%.  相似文献   

16.
根据耦合度量学习方法能够直接处理不同集合的数据这一特性,将其应用到数据融合领域,提出了一种基于耦合度量学习的特征级融合方法.该方法首先通过增加对原始单个集合中具有相关关系的数据的优化处理,将耦合度量学习方法的目标函数改进成在耦合空间中所有具有相关关系的投影特征均彼此接近,从而使得这些特征的整体分布更满足特征级融合的需求,而后采用串行方式对特征进行融合,最终得到更加有效的特征用来分类识别.将上述方法应用到步态识别中,以解决步态识别中的数据融合问题.采用CASIA(B)步态数据库进行实验分析,结果表明该方法识别效果较好.  相似文献   

17.
近邻传播算法(AP)不需要事先指定聚类数目,在程序运行过程中,能够自动识别聚类中心及聚类数目。在同一批数据集上,AP算法聚类结果稳定,鲁棒性好。除此之外,AP聚类算法可以采用多种距离度量方式,聚类结果精确。针对近邻传播算法(AP)不能对异构数据进行聚类的问题,提出一种基于张量距离的高阶AP聚类算法。该算法首先利用张量表示异构数据对象,然后将张量距离引入AP聚类算法,用来度量异构数据对象在张量空间的相似度。张量距离的引入,不但能够度量异构数据对象在数值上的差异,同时能够度量异构数据对象在高阶空间中位置的差异性,有效的捕捉异构数据对象的分布特征。实验结果表示,提出的高阶AP算法能够有效的对异构数据对象进行聚类。  相似文献   

18.
聚类分析是一种数据缩减技术,即基于数据特征的相似性将数据聚集成不同的类,是数据挖掘中一种非常有效的工具,得到了人们广泛的关注。从聚类算法中的相似性度量问题入手,采用基于流形距离的相似性度量替代传统的基于欧氏距离的相似性度量,通过二阶段聚类解决引入流形距离带来的计算量增大问题,并将这种聚类算法应用到聚类分析当中。  相似文献   

19.
唐永红 《科学技术与工程》2013,13(7):1832-1835,1859
针对混合属性数据集对象间差异性度量丢失原有数据特性的问题,引入了新的差异性度量方法,构造出对象的混合属性异常因子。在此基础上提出一种新的基于混合属性数据集的局部密度异常检测算法。实验结果表明,该算法高效可行,检测精度高,且参数设置简单。  相似文献   

20.
少样本学习旨在利用少量数据训练深度学习模型,并将其快速泛化到新任务中.在这一领域,少样本细粒度图像分类是最具有挑战性的任务之一,原因在于细粒度图像具有类内方差大、类间方差小的特点.为了解决这一问题,本文提出了一种基于距离与方向双重度量的神经网络,分别利用欧氏距离衡量特征间的绝对距离差异和余弦相似度衡量特征间的相对方向差异,以提升度量信息多样性和样本特征的判别性.同时,为了与当前先进的少样本细粒度图像分类方法对比,将特征提取器在不增加深度的前提下设置为双路形式,以适应不同度量方法对嵌入特征信息的需要.此外,设计了彼此分离的通道和空间注意力机制,分别通过自适应通道注意力和空间信息交叉注意力对不同阶段的提取特征进行增强,从而挖掘重要分类信息.最后,通过双相似度模块分别计算两种差异信息的度量结果,并选取一定权重融合得到最终的相似度分数,实现绝对差异与相对差异在度量空间中的协调补充.在4个主流细粒度图像分类数据集上进行实验对比与分析,最终结果表明了所提方法在相同设置下最多实现了7.0%左右的分类准确率提升.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号