首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
音频分类使机器具有识别音频样本类别的功能,而与传统音频分类模型不同,零样本学习模型可以识别训练期间未出现的音频类别样本。但是,当前的零样本音频分类方法在做类间信息迁移时大多依靠类别标签文本语义信息的先验知识,而语义的先验知识包含大量与音频非相关的冗余信息,所导致的知识转移性能的局限性大大限制了零样本学习模型识别能力。基于此,文中提出将与音频信息高度相关的人工听觉描述子作为类间迁移信息,同时使用合成分类器,构建了零样本音频分类模型。在ESC-50数据集的实验中,与先前的工作相比较,基于人工听觉描述子的零样本音频分类具有更好的分类性能。  相似文献   

2.
传统协同表达分类(CRC)算法因直接使用原始样本构造非传统字典,容易受到样本维度、光照和姿态变化等因素的影响。该文在协同表达框架基础上,提出了一种新的利用分块加权局部二值特征(LBP)直方图向量构造解析字典的协同表达人脸分类方法。首先通过分块加权方法优化LBP算子提取的纹理特征,然后采用解析字典学习方法将样本数据投影到稀疏系数空间,并使用协同表达方法重构测试样本,完成样本分类。与已有算法相比,该文算法的实验结果较好。ORL和LFW数据库上的实验结果证明了该文方法的有效性。  相似文献   

3.
提出将语义理解与统计学方法相结合的机器学习算法来进行文本情感分类。首先提取文本中的情感词汇作为特征,利用统计学方法得到特征的初始权重,然后通过分析文本语义结构修改特征权重,最后利用Bayesian算法和以Bayesian作为基本分类算法的Boosting算法进行分类。实验表明,基于语义理解的Bayesian分类算法的分类准确率高于仅基于统计学的Bayesian分类算法,基于语义理解的Bayesian-Boosting算法的分类准确率最高,达到了90%。  相似文献   

4.
改进传统的基于二叉树结构的支持向量机多类分类方法。将无监督聚类引入到算法中,利用无监督聚类剔除大量的非支持向量样本,同时对于无监督聚类在异类样本相近时出现的性能下降问题,引入线性判别分析使得同类样本聚集,异类样本分散,确保聚类精度。线性判别分析和无监督聚类结合能够显著地缩减训练样本。该方法能够在保持分类准确率的情况下有效地提高SVM的分类速度。  相似文献   

5.
中医证候和症状描述错综复杂,如何较好地对病患所属证候进行鉴别诊断,一直是临床医疗工作者的首要目标.把潜在语义分析(latent semantic analysis,LSA)技术与中医知识特点(即证型的临床表现与心、肝等脏腑各系类证的临床表现有相同描述集)相结合进行分类的方法应用到中医证候的诊断识别中,是一个较好的尝试.实验结果表明,该方法取得了良好的效果.  相似文献   

6.
为解决基于表示理论的分类法未考虑噪声样本对重构系数影响的不足,利用局部约束协同表示法改进最小二乘回归分类法,提出局部强化最小二乘回归分类法.该方法通过非负稀疏表示自适应选择近邻样本,并利用近邻样本的协同作用强化重构系数使得局部强化最小二乘回归分类法具有较好的鲁棒性和容噪性.该方法可以克服传统分类方法存在的过拟合问题.在4个人脸图像数据集上的实验结果表明该方法可以提高人脸识别准确率.  相似文献   

7.
KNN算法在分类准确率和召回率方面具有较好的性能,但由于样本相似度计算开销大,导致分类效率低.针对此问题,本文提出一种基于密度的训练样本裁剪算法,对训练样本的各个样本类进行聚类,根据密度不同聚集成不同的簇,删除噪声数据并计算每个样本类的相似度阈值,然后将样本类内大于类相似度阈值的样本进行合并,以减少训练样本总数.实验表明,此样本裁剪算法能够在保持KNN算法分类性能基本稳定的前提下,实现各个样本类内高相似度样本的合并,减少分类计算开销.  相似文献   

8.
9.
网络数据的正确分类对于网络环境的监控和维护具有重要作用。在数据不平衡状态下解决数据分类和处理复杂的特征关系尤为重要,为此提出一种改进SMOTE(synthetic minority over-sampling technique)+GA-XGBoost(genetic algorithm-extreme gradient boosting)的机器学习分类方法。将局部离群因子引入SMOTE插值过程,对少数类样本过采样,并对多数类样本随机欠采样,从而实现样本再平衡;同时,在模型训练过程中为增加模型拟合度,将具有进化迭代优势的遗传算法与XGBoost相结合,解决XGBoost参数众多、特征学习收敛较慢等问题。实验采用UNSW_NB15数据集,选择多层感知机、K近邻、决策树等机器学习算法及SMOTE+XGBoost等不平衡数据训练方法进行试验对比,结果表明该方法具有较好的分类预测准确率(97.40%)及较高的平均召回率(70.2%)和平均F1-score(68.8%)。并在本实验室工业信息安全平台采集的数据进行实验研究,分类准确率为99%,进一步验证了该方法的有效性和可行...  相似文献   

10.
欠抽样是一类常见的解决非平衡数据分类的技术。传统抽样方法(如Kennard-Stone抽样和密度保持抽样)只考虑保持数据分布。已有欠抽样方法侧重抽取分类边界附近的样本,这样抽取的样本可能改变数据的原始分布特征,从而影响分类效果。提出数据冗余度的概念,即如果一个多数类样本处于多数类的密集区且距离分类边界或少数类样本较远,则样本冗余度较高。去冗余抽样(Redundancy-removed Sampling,RRS)采用传统抽样规则去掉多数类中冗余度相对较高的样本。这样的样本子集尽量包含对分类最有帮助的样本和保持原始数据分布,且两类样本数量相对均衡。实验结果表明,经RRS抽样的分类结果的总体精度高于其他抽样方法,尤其在分类精度较低的数据集上。同时,少数类样本的判别精度也有所提高。  相似文献   

11.
一种融合多种语义特征的中文问题分类方法   总被引:1,自引:0,他引:1  
针对中文问题分类方法中提取语义信息不准确和特征向量维数过高导致处理速度过慢的问题,提出了一种融合多种语义特征的问题分类方法。借助HowNet,兼顾问句的句法和语义信息,选取问题疑问词、核心词的主要义原、命名实体、名词单/复数等四种分类特征,并在义原的提取过程中加入词义消岐技术,对事实疑问句进行分类。在某高校信息检索研究室的中文问题集上进行实验,实验结果证明了该方法的有效性,大类准确率92.82%,小类准确率84.45%,取得了较好的效果。  相似文献   

12.
针对AD AdaBoost算法在样本训练过程中的退化现象,提出了一种基于改进的AD AdaBoost算法的人眼检测方法,通过释放正确分类负样本的权值并进行归一化处理,缓冲分类困难的样本上权值的扩张.实验结果表明此方法在保持较好实时性的同时,能够提高检测的准确率.  相似文献   

13.
为了提高低维空间对原始高维样本的表示能力,该文提出了依概率分类的保持投影算法(PCPP)。PCPP考虑了样本类别信息,并重新定义类内样本间的相似性,包含样本的邻域信息,而且在K近邻选择下,还能反映样本被正确归类的概率。样本经投影后,在低维特征空间内,被正确归类且概率较大的类内样本间的邻域关系得到了保持。在Yale、FERET及AR人脸库上的人脸识别实验表明,PCPP较其他算法取得了更好的识别性能。  相似文献   

14.
针对在工业过程中数据普遍存在的非线性特性,基于数据的局部相关关系对分类的影响,提出一种基于t分布随机邻域嵌入(t-SNE)的数据特征提取和故障分类方法。利用t-SNE算法非线性、非参数降维的优势,与费舍判别分析(FDA)、支持向量机(SVM)分类器相结合建立故障分类模型。利用t-SNE算法对故障数据进行非线性特征提取,获取数据的关键区分特征。用FDA和SVM算法实现故障分类和识别。通过田纳西-伊士曼(TE)过程获得的实验数据进行实验仿真分析,并分别与基于核主元分析法(KPCA)、拉普拉斯特征映射(LE)构建的KPCA-FDA、LE-FDA、KPCA-SVM、LE-SVM 4种故障分类模型进行比较。定量评估结果表明:即使基于不同分类器,相较于其他2种方法,该文方法的分类准确率分别提升了2%和7%,且其平均分类准确率能保持在97%以上。  相似文献   

15.
基于聚类和SVM的数据分类方法与实验研究   总被引:1,自引:0,他引:1  
提出一种新的数据分类方法,K-均值聚类分组支持向量机(CG-SVM)方法,在不删减任何样本信息的情况下,该方法使用轮廓系数作为类分离度量参数对数据的正、负类样本进行聚类、分组,对小组进行交叉结合训练,得到不同的SVM分类器,根据测试样本到聚类中心欧氏距离的加权来选择合适的SVM分类器进行类别判断,该方法实现了一个二分类问题转化为多个细分的二分类过程,效果由差变好.对所提方法分别进行了仿真数据和实际数据分类实验.实验结果表明,与传统的SVM方法相比,该算法可以有效地提高分类的准确率.  相似文献   

16.
提出一种新的数据分类方法,K-均值聚类分组支持向量机(CG-SVM)方法,在不删减任何样本信息的情况下,该方法使用轮廓系数作为类分离度量参数对数据的正、负类样本进行聚类、分组,对小组进行交叉结合训练,得到不同的SVM分类器,根据测试样本到聚类中心欧氏距离的加权来选择合适的SVM分类器进行类别判断,该方法实现了一个二分类问题转化为多个细分的二分类过程,效果由差变好.对所提方法分别进行了仿真数据和实际数据分类实验.实验结果表明,与传统的SVM方法相比,该算法可以有效地提高分类的准确率.  相似文献   

17.
针对绿色工艺评价样本具有不确定性、多维性以及量纲差异大的特点,为实现样本的合理分类,提出一种基于核的模糊可能性聚类新算法.该方法将核模糊聚类算法、可能性聚类算法和减法聚类算法相结合,以提高聚类的准确率;使用聚类有效性指标作为分类条件,自适应确定最佳分类数.仿真实验结果表明,该算法具有较好的有效性和鲁棒性,并将该算法运用在绿色工艺评价样本分类中,得到了较好的分类效果,验证了算法的实用性.  相似文献   

18.
近年来非平衡多分类数据的学习问题在机器学习和数据挖掘领域备受关注,上采样技术成为解决数据不平衡问题的主要方法,然而已有的上采样技术仍有很多的不足,例如新合成的少数类样本仍可能分布在对应少数类样本的原始区域内,不能有效改善数据分布的不平衡情况.此外,若原始样本中不同类别样本分布存在重叠,则新合成的样本会更容易偏离到其他类样本分布中,从而造成过泛化现象,影响少数类样本的分类精度.为解决上述问题,提出一种二次合成的上采样方法(Quadratic Synthetic Minority Over-sampling Technique,QSMOTE).首先通过少数类样本的支持度选择包含重要信息的样本来进行第一次合成,然后通过分析指定少数类样本质心的邻域内样本分布情况来调整第二次样本合成范围,并最终进行第二次合成.在UCI和MNIST数据集上的实验结果表明,QSMOTE不仅可以改善数据分布的不平衡问题,而且可以尽可能地减少过泛化现象,特别是对少数类样本的分类准确率有大幅提升.  相似文献   

19.
为提高在非限制环境下多种人脸姿态特征点定位的准确性,该文提出了1种新的人脸特征点定位算法。在基于级联回归的多视角模型的训练和测试过程中,使用姿态分类算法对不同的人脸样本进行分类。使用多视角模型集成策略预测特征点位置。实验证明,与显示形状回归(ESR)等算法比较,该文算法对非限制环境下人脸表观变化有更好的鲁棒性。  相似文献   

20.
为了解决高维小样本的特征选择问题,该文结合文化基因算法(Memetic algorithm,MA)与最小二乘支持向量机(Memetic algorithm and least squares support vector machine,MALSSVM),设计了一种封装式(Wrapper)特征选择算法。该方法将全局搜索与局部搜索相结合作为求解策略,利用了最小二乘支持向量机易于求解的特点,构造分类器,以分类的准确率作为文化基因算法寻优过程中适应度函数的主要成分。实验表明,MA-LSSVM可以较高效稳定地获取对分类贡献较大的特征,降低数据维度,提高了分类效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号