首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 9 毫秒
1.
数据集独立同分布(Independent and identically distributed, IID)的假设和数据集是否干净,分别对应组合域标签噪声领域数据集非独立同分布(Non-independent and identically distributed, Non-IID)和标签噪声问题。该文提出多标签图像多分类模型(Multi-label image multi-classification model, MIMM)预处理方法应对上述问题。为了缓和数据集独立同分布假设,该文证明组合域方法的迁移误差上界,并使用最大关键特征(Maximum key feature, MKF)函数和关键秩匹配分解(Key rank matching decomposition, KRMD)算法实现源域向组合同构数据的目标域迁移。为了保证数据集干净,引入干净的第三方数据微调模型参数,排除标签真实数量不确定导致训练集类别不平衡的情况。在Pascal/COCO数据集上进行实验,结果证明MIMM方法已达到准确率与运行效率的最佳平衡。  相似文献   

2.
主动学习时向专家查询得到的标注如果带有噪声,将会影响学习的性能.为减少噪声,人们提出了基于“少数服从多数”的多专家主动学习算法,但该算法的缺点是代价往往太高.文章采用了一种自我训练(self-training)方法,对某些平均置信度高的样本,直接确定其分类标注,不必向专家查询,以节省学习代价.同时,使用置信度差异作为度量标准,选取那些最不确定的样本向专家查询,提高了学习效率.在UCI数据集上验证了本文算法的有效性.  相似文献   

3.
讨论了语音识别中使用支持向量机(support vector machines,SVM)对音子级置信度进行综合的方法. 音子级置信度得分采用传统的方法计算而得,并使用SVM对音子级置信度进行综合得到词级的置信度得分. 在说话人无关的汉语孤立词识别实验中,使用作者方法比使用传统方法获得的系统等错误率rEER(equal error rates,EER)有明显降低,可以从基线系统的28.14%降低到23.71%,而系统的复杂度仅有小幅度的上升.  相似文献   

4.
基于语音识别置信度的英语语言学习算法研究   总被引:2,自引:0,他引:2  
语音识别技术是实现一个语音学习系统的关键。由于目前的英语学习软件并不能完全满足用户的要求,因此该文提出了将语音识别置信度引入语言学习的方法。在讨论了置信度的基本原理和在语言学习中的作用之后,提出了一种新的算法并在此算法基础上最终建立了一个基于置信度技术的英语语言学习系统。在TIMIT语音库中的实验结果表明,语音识别置信度可以有效地提高语言学习系统的性能;当门限值设置于-0.7和-1.0之间,虚警率(false alarm)在1.1%左右,漏报率(false rejection)在0.65%左右,并且在一定条件下可以有效地反映学习者发音的质量,基本上可以达到实用的要求。  相似文献   

5.
近年来,随着机器学习的发展,分类系统的性能有了很大的飞跃。模型需要大量带标签数据才能使训练结果达到要求,而获取高质量的标注数据费时费力。为了降低成本,出现了众包、自动化系统等方法标注训练数据。但是,这些标注方法往往会产生大量错误标注,即标签噪声。另外,信息不足、专家错误和编码错误等因素,也可能使标签受到污染。训练过程中对标签噪声的处理不当,可能会使预测精度和准确性降低,或者使模型复杂度增加。因此,研究标签噪声对推广机器学习在各领域的应用和降低机器学习算法的部署成本等方面具有重要意义。通过综述产生标签噪声的原因、影响以及近几年来应对标签噪声的一些技术方法,对标签噪声的研究现状和发展前景进行分析。  相似文献   

6.
利用车牌识别技术来管理车辆已成为现实,针对车牌识别时间长等提出了一种基于置信度分析的加速算法;同时为提高车牌识别精度,对BP网络进行了优化及改进;通过实际试验,识别率在90%以上,基本达到理想效果.  相似文献   

7.
基于环境特征的语音识别置信度研究   总被引:2,自引:0,他引:2  
传统的语音识别置信度方法基于各种静态特征进行分类判决,而忽略了词与周围环境之间的关系所携带的信息。为了进一步提高置信度特征的分类性能,该文提出了上下文环境、动态环境、句全局环境共3类5种环境特征,从空间与时间角度较全面地描述了词与环境之间的关系。实验结果表明:静态特征与环境特征联合分类的性能与只用静态特征相比有不同程度的提高,其中,静态环境与环境特征的二元联合最高有5.02%的相对改进,三元联合最高有6.11%的相对改进,说明环境特征确实是一种有价值的置信度特征,并且这几类环境特征之间存在一定的独立性。  相似文献   

8.
基于可靠度与置信度的双可靠性指标安全系数方法   总被引:1,自引:0,他引:1  
在可靠度指标的基础上引入了置信度指标,提出可靠度与置信度的双可靠性指标的安全系数概念,并根据可靠性理论推导出新计算公式.该公式考虑了实验数据样本容量的影响,给出了小子样实验数据条件下的安全系数取值.将新安全系数应用于结构可靠性设计,算例结果表明,与其他方法相比,此方法计算结果安全系数更合理,且简单实用,能满足结构可靠性设计的要求,可取得显著的减重效果.  相似文献   

9.
提出了一种融合标签局部相关性的标签分布学习(label distribution learning, LDL)算法,该算法分为3个阶段。初始预测阶段构建多层神经网络模型,将样本的原始特征作为输入、初始预测的标签分布作为输出;局部矫正阶段首先利用k-means聚类算法获得不同类所描述的局部信息,然后针对不同类计算对应的协方差矩阵,利用该矩阵来矫正初始预测的标签分布,获得每个类对应的矫正标签分布;标签融合阶段对矫正后的标签分布进行加权,再与初始预测的标签分布进行融合,得到最终的预测分布。在8个公开数据集上与9种常用的LDL算法进行对比实验,结果表明本文的算法能较好地描述标签局部相关性,在多个主流评估指标上排名靠前。  相似文献   

10.
列车在高架铁路运行时辐射的噪声与路基线路存在较大差异,特别是当线路采用了声屏障后,高架结构辐射的噪声对沿线环境的影响将显现.文中应用动力学基本理论建立了车-桥线路的耦合模型,获得了列车运行时轮轨之间的作用力,将其作为高架结构的统计能量分析的输入,研究了高架结构振动与声辐射,并应用高架结构的振动测试,进行了模型验证.应用该模型研究了200km/h速度下列车运行引起的高架结构噪声辐射,分析了轨道垫板的刚度变化对高架结构声辐射的影响,得出了优化轨道垫板的刚度可以提高高架结构声屏障的总体降噪效果的结论.  相似文献   

11.
飞机巡航近场噪声经验预测方法研究   总被引:2,自引:1,他引:1  
巡航状态下的机体表面噪声,其声源分为点声源和分布式声源.推进系统噪声中,风扇、压气机、核心、涡轮噪声可视为点声源,采用飞行修正的远场噪声预测方法.喷气噪声和机体噪声(机翼或尾翼后缘噪声、机身湍流边界层噪声)则为分布式声源,采用工程近场的方法进行预测.采用噪声源半经验参数关联模型,发展了巡航条件下的机体表面噪声预测计算方法.该计算方法可以对飞机机体(机身、机翼或尾翼等)外表面声场进行预测,并能够对各噪声源的辐射特性进行计算.以ARJ21-700为例:飞行高度10 000 m,飞行马赫数0.7,对机背表面(纵轴)5个点进行了声场预测.计算结果表明:风扇噪声是巡航条件下的最主要声源,其次为涡轮噪声、后缘噪声以及喷气混合噪声,各观察点的次要噪声源有所不同.  相似文献   

12.
针对现有标签分布学习(Label Distribution Learning,LDL)算法较少考虑标签间关联性的问题,提出一种融合结构化标签依赖性的LDL算法.算法分为扩展、学习和恢复三个阶段:在扩展阶段,结合成对标签之间的关联性,构建结构化标签依赖性;在学习阶段,结合该依赖性,构建学习框架;在恢复阶段,利用最小二乘法求解超定方程组以预测标签分布.与七种常用的标签分布学习算法相比,在八个开放数据集上进行实验,提出的算法在Euclidean距离、S?rensen距离、Squard χ2距离、Kullback-Leibler散度、Intersection相似度和Fidelity相似度六个主流评估指标上明显占优.  相似文献   

13.
多标签流形学习(multi-label manifold learning, ML$^{2}$)基于特征流形构建标签流形, 将标签逻辑值转换为实数值, 能更好地反映标签相关性, 提高分类性能. 但是, ML$^{2}$ 与多数多标签分类方法一样, 是基于数据的全部特征进行标签预测, 没有考虑不同特征对不同类别标签的鉴别能力. 因此, 提出一种基于类属特征的多标签流形学习分类(label specific feature based multi-label manifold learning, LSF-ML$^{2}$)方法. 首先, 利用标签数据优化类属特征重要度矩阵, 确定类属特征子集; 再将子集的特征流形映射到标签空间, 使标签从离散型变为数值型; 最后, 通过多输出回归实现分类. 实验结果表明, 所提方法性能优于多种多标签分类方法.  相似文献   

14.
流标签是当前多标签学习领域中一个较新颖的挑战性问题,存在标签空间未定、标签数量不断增加甚至趋于无穷等问题.在多标签学习的特征选择中,每当有新的标签到达时标签空间都将发生改变,传统的多标签特征选择算法需重新进行特征选择,所以不适用.针对此问题,采用将流标签进行分组批量处理的方式,并考虑标签之间的相关性,提出一种新的流式多标签特征选择方法,考虑分组后每组标签内部潜在的关联结构和不同标签组之间的标签差异性,赋予每组标签不同的权重来计算每个特征与标签空间的模糊互信息.同时,结合mRMR (Max-Relevance and Min-Redundancy)的特征选择策略进行冗余特征的剔除,从而挑选最优的特征子集.该方法同时适用于固定标签空间和流式标签空间中的特征选择问题.最后,选取八个多标签基准数据集,采用四种评价指标与已有相关的多标签特征选择方法进行对比实验,实验结果证明了提出方法的有效性和高效性.  相似文献   

15.
利用关系分类模型,将标签之间的相关性以及特征对标签相关性的影响形式化为分数模型,通过要求模型能够区分真实数据和噪声数据的得分建立了基于张量网络的多标签分类模型.多个数据集上的实验表明,相较于传统多标签学习方法和已有考察标签相关性的多标签学习方法,本文方法在平均精确度和错误率等多标签评价指标上提升近一倍,且拥有更低的计算成本.  相似文献   

16.
对一台350/700型球磨机进行筒内降噪设计,用统计能量法进行分析,论述了该模型的合理性与可靠性,研究了模型简化、统计计能量法子系统合并、参数的获取、共振与非共怕伟递等问题。  相似文献   

17.
为了确定多标签分类器链方法的链序以及挖掘出高阶标签关联性,提出了一种基于梯度提升的多标签分类器链方法.给出了GB C C整体框架,通过一种预剪枝策略对单一标签进行梯度提升,在此过程中利用标签置信度和误差评价分数确定最佳链序,并在各个标签间进行标签传递和特征传递,以挖掘高阶标签关联性.将所提出方法与4种分类器链方法(CC、ECC、OCC、EOCC)以及4种多标签分类方法(BR、HOMER、MLKNN、CLR)在bibtex、Corel5 k等12个多标签数据集上进行对比试验.结果表明:新方法在各个评价指标(micro-F1、macro-F1、Hamming loss、One-error)下不仅能够有效提升预测性能,而且能够保持分类器链方法的简单灵活性.  相似文献   

18.
通过分析传统基于概率度量的K邻近置信度评估方法,提出一种基于最大差距的置信度评估方法,并在UCI数据集上对两种方法进行对比实验.实验结果表明,基于最大差距的置信度评估方法在宏平均召回率、宏平均精度及所用时间上均优于K邻近置信度评估方法,从而可进一步优化半监督分类学习中数据样本的置信度评估.  相似文献   

19.
针对标签特定特征多标签学习算法(multi-label learning with label-specific features, LIFT)未能在聚类以及分类阶段考虑标签相关性问题,提出一种基于标签相关性的标签特定特征多标签学习算法(multi-label learning with label-specific features via label correlations, LFLC).将标签空间加入特征空间进行聚类构建分类模型,采用考虑标签相关性的聚类集成技术为每个标签构造标签特定特征,使用相关性矩阵构建无向完全图并挖掘图中标签集合相关性,通过树集成表达标签间多种不同结构的强相关性.在试验部分,采用涵盖不同领域的10个数据集,以Hamming Loss、Ranking Loss、One-error、Coverage、Average Precision和macroAUC为评估指标,进行了参数敏感性分析和统计假设检验.结果表明:结合聚类集成与标签间强相关性的LFLC算法较其他对比多标签算法整体上能取得较好的效果.  相似文献   

20.
对一台350/700型球磨机进行筒内降噪设计,用统计能量法进行了分析,论述了该模型的合理性与可靠性,研究了模型简化、统计能量法子系统合并、参数的获取、共振与非共振声传递等问题.原球磨机噪声的实测值与用SEA方法预测值比较一致,说明该模型是合理可靠的,并对处理之后的球磨机降噪量进行了预测,其值大约在10dB左右.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号