首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
音乐流派识别(music genre recognition,简称MGR)是一项应用前景广阔的研究领域,同时也能够为音乐机器学习技术提供一个良好的测试台.在过去几年中,涌现出了大量基于机器学习的MGR系统.然而,单纯依靠底层声学特征的MGR算法在分类时往往不能得到令人满意的结果.作者受到语境化机器学习技术的启发,提出了基于堆叠泛化的MGR分类系统.该系统通过提取互联网中用户标注音乐时使用的标签,同时融合声学特征完成语境化音乐流派识别.在论文中,MGR系统分为内容层和语境层,内容层由提取Mel倒谱系数(Mel frequency cepstrum coefficient,简称MFCC)和快速傅里叶变换(fast Fourier transformation,简称FFT)特征的声学特征表示,语境层由额外标签表示.在数据集GTZAN的实验结果表明,在数据集GTZAN下,语境化的MGR分类准确率远高于基于声学特征的MGR分类准确率,实现了20%的分类性能的提升.  相似文献   

2.
基于人工智能的乐器识别是音频识别和处理中的重要一环,在近20年来的研究中取得了丰硕的成果,也面临着一些问题.鉴于目前国内的相关研究较少,重点介绍了国际乐器识别领域的研究热点,阐述了应用于乐器识别的特征提取、数据资源、几类常用的数据处理原理及模型.在介绍国际上乐器识别领域的主要成果时,重点阐述了基于机器学习和深度学习的人工智能技术在复调音乐乐器识别和标注中的应用.本综述对于我国开展相应的研究可以提供一些经验和参考.  相似文献   

3.
音乐情感识别是音乐检索的一个重要组成部分.基于音乐声学特征分析,尝试提取代表音乐声学特性的时域、频域、倒谱域的各种特征,并利用支持向量机(support vector machine,简称SVM)算法对中文音频进行情感分类,以研究不同特征组合在音乐情感分类上的效果.通过对比各种不同特征组合的音乐情感识别效果,发现由4个时域特征、频谱、幅度谱和相位谱组成的音乐特征对中文音乐情感分类的效果良好.  相似文献   

4.
四川广汉三星堆遗址是一处早期蜀文化古遗址群,在七十余年的发掘历史中,先后出土文物数千件。其中出土的具有音乐声学性能的器物,与战国时期蜀乐器和商代乐器之间有相似之处,并表现出蜀音乐文化自身的特征。通过考证与分析研究,这些器物的乐器功能浮出水面。  相似文献   

5.
近年来发展的语音理解是建立在语音识别和自然语言理解之上的热门研究领域。语音文摘是语音理解中一个重要研究应用,主要研究方向有:1)书面文档文摘技术在语音文档文摘提取的应用研究;2)新兴的基于结构建模的语音理解与文摘的研究。近年来,该领域已经有许多重要的研究成果。本文对近年语音理解领域中的语音文摘研究成果进行综述,最后展望未来语音文摘技术可能的研究热点。  相似文献   

6.
先秦时期音乐声学领域的成果是巨大的。乐器声学的发达,使乐器制造由简单、粗糙的形制发展至发声原理更为科学的程度。至于律学的发展成就,代表了中国音乐艺术的理论高度,由更重要的意义。本文从乐器声学、律学两个方面的整理、论述,说明正是由于音乐声学的发展使得先秦音乐艺术在世界上取得了领先的地位。  相似文献   

7.
随着人们对社会安全要求的增加,基于生物特征识别的智能身份鉴别方法逐渐受到广泛的关注.由于虹膜识别具有高可靠性和非侵犯性,它正成为生物特征识别领域中的一个研究热点.看守所关押人员安全监控正从安全性较低的口令、门禁卡等传统方式向安全性更高的生物特征识别认证技术发展.虹膜识别以其超群的安全性、可靠性成为新型看守所关押人员安全管理认证系统的首选.  相似文献   

8.
乐器识别领域中,传统降采样或全局映射方法得到的特征对输入表达不够准确且判别能力不足.为此借鉴图像领域聚合局部特征的思想,提出一种结合频谱特征和图像领域特征聚合策略的方法.考虑涉及中国传统乐器的研究较少,建立了包含12种中国传统乐器的独奏音乐数据集.为适应频谱图输入,对ResNet34的变体网络模型进行了修改,在建立的数...  相似文献   

9.
人脸表情识别就是让计算机按照人类的思维理解表情,是人机交互的重要组成,然而随着深度学习的迅速发展,深度学习技术在人脸表情领域的研究也成为研究热点,所以对深度学习技术在表情识别中的应用及取得的成果进行分析。首先总结了几种常用表情数据集;然后从特征提取和特征分类两方面对基于深度学习的表情识别方法进行了分类,并从网络改进方面分析了基于深度学习的表情识别中的几种网络改进方法;最后阐述了表情识别这一领域中面临的挑战和未来发展。  相似文献   

10.
随着高分辨成像技术的发展,雷达能够获得目标更为精细的特征信息,为目标识别提供了有力支撑,因此,近年来雷达成像技术已在地球遥感、海洋监测、资源勘查、空天防御等领域得到广泛应用。随着对目标精细、高效识别需求的不断提升,雷达成像新模式、新体制、新方法、新应用不断涌现,已成为当前雷达技术领域的研究热点。本专题主要依托“空天非合作目标雷达学习成像及认知识别一体化处理关键技术”“机载太赫兹合成孔径雷达运动补偿与信号处理关键技术研究”“基于稀疏贝叶斯学习的复杂环境空间目标高分辨ISAR成像方法研究”“涡旋电磁波雷达目标微多普勒效应分析与微动特征提取技术研究”“雷达稀疏正则化量子增强快速成像方法研究”“基于参数化稀疏表征技术的SAR海面机动目标运动参数估计与成像方法研究”等国家自然科学基金项目,汇聚了雷达成像技术领域的最新研究成果,以期推动雷达成像新技术的学术交流与创新应用。专题采用实验视频及原理介绍等增强出版形式,以加深读者对论文内容的理解。  相似文献   

11.
声发射技术在滚动轴承的检测中得到了广泛应用,声发射信号处理是检测中的关键技术问题,常用的声发射信号处理技术有参数分析、波形分析、小波分析、模式识别等等。综述了21世纪以来声发射信号处理技术在滚动轴承检测中应用现状,国内外学者在将各种声发射信号处理技术应用于滚动轴承检测方面做了大量研究且取得了一定程度上的研究成果。需要进一步研究的内容是规范各种工况下声发射信号处理方法并设计标准的声发射信号处理平台。  相似文献   

12.
刘亚雷  顾晓辉  甘宁 《科学技术与工程》2020,20(28):11620-11625
针对声源识别中观测模型线性化误差,信号特征参数提取依赖于经验分析阈值判断而造成信息丢失的问题,本文从信号观测模型、预处理、特征提取与分类识别、半实物仿真试验等方面,提出了一种新的四元阵列融合声源识别方法。首先在系统坐标系下建立了四元阵列有色噪声环境下的观测模型;其次基于EMD理论,给出了四元阵列EMD融合算法,有效抑制了高频信号的干扰;再次基于MFCC-DTW方法,设计了阵列信号特征提取与分类识别算法;最后通过半实物仿真试验,并与相关研究基础对比,分别验证了本文提出的EMD融合算法及阵列信号特征提取与分类识别算法的有效性。  相似文献   

13.
小波变换与FFT联合识别乐音   总被引:1,自引:0,他引:1  
单一音符是规则的周期信号,利用FFT可以获得最佳频域分辨.但由于乐音的谐波成分非常丰富,直接实施FFT无法准确检测基音.笔者首次提出小波变换DWT和FFT结合的乐音音符识别方法,该方法充分利用了DWT的低通分解迅速、低频近似信号的平滑性好等优点,实现了乐音基音频率的精确识别,是乐音音符识别的一个很好的方法.  相似文献   

14.
针对微小深孔钻削刀具磨损状态检测的工程需求,提出了基于钻削声信号的麻花钻头磨损状态识别方法。根据不同磨损程度的麻花钻在钻削过程中的声信号,使用经验模态分解(empirical mode decomposition, EMD)将声信号分解成若干个固有模态函数(intrinsic mode functions, IMFs),通过时频联合分析探索刀具磨损与声信号特征之间的关联规律;再使用麻雀搜索算法(sparrow search algorithm, SSA)优化支持向量机(support vector machine, SVM)的参数,并利用SVM实现基于声信号特征的刀具磨损状态识别。实验结果表明,微小深孔钻头磨损程度与钻削声信号特征之间存在非线性耦合关系,声信号高频特征对钻头磨损程度的变化非常敏感;采用经过SSA优化后的SVM算法,基于优选的IMF特征能够准确识别钻削刀具磨损状态,识别准确率可达98.246%。  相似文献   

15.
针对以往依赖鼠标、键盘等传统设备的交互方式,其易受到各种场景和使用环境的限制,已成为虚拟现实以及新型显示技术发展的屏障,因此提出了一种基于SEMG分析的交互意图感知方法。由于连续表面肌电信号的实时识别不能通过单独的动作产生的活动段进行信号的分割识别,采用一种连续表面肌电信号的上下文分割思想进行实时信号识别。最后对识别出的信号进行模糊决策的交互意图分类,将识别的信号数据对设备进行交互感知控制。通过实验分析可知,基于SEMG分析的人机交互能够较好地感知识别人的不同意图动作,交互识别正确率能够达到95%以上。  相似文献   

16.
智能雷弹的目标被动探测系统研究   总被引:2,自引:1,他引:1       下载免费PDF全文
战场目标被动探测技术是智能雷弹设计的一个关键性技术,研究了利用声和振动传感器对目标信号进行探测的防坦克智能地雷,该系统利用预警电路和TMS320C30控制的数据采集与信号处理电路对坦克目标的声和振动信号进行处理,实现了系统对目标的预警、识别和定位,达到了项目预期设计要求。  相似文献   

17.
姜琦  冯庆胜 《科学技术与工程》2022,22(16):6680-6686
为了准确地识别铁路转辙机所处的工作状态,保证列车能够安全行驶并转向,提出了一种基于声音信号的转辙机状态识别方法。首先将声音信号预处理后提取其梅尔倒谱系数(Mel frequency cepstrum coefficient, MFCC);为更加全面表征转辙机声信号的特点,对MFCC进行改进得到多尺度MFCC特征;引入卷积神经网络(convolutional neural network, CNN)构建转辙机声信号识别模型,并采用五折交叉验证法获得两种特征的识别准确率。将S700K型转辙机在4种状态下运行时采集的真实声音信号进行训练和测试。结果表明:多尺度MFCC特征可使转辙机声音状态识别准确率至少提高7.5%。并且在低信噪比(signal-to-noise ratio, SNR)下,多尺度MFCC特征也有更好的表现,其准确率相较传统MFCC可提升35%。  相似文献   

18.
常规的Internet分组差错采用错包丢弃或邻包重复,对注重实时性的VoIP是简洁而有效的。作为无噪音的注重乐感和旋律的古典音乐,则更注重人耳对音乐的个体感知。文中给出了Internet流媒体服务器传输古典音乐场景,提出一种新的分组丢失隐藏(PEC)方案,不仅解决单个分组丢失恢复,还解决带音符起点的分组丢失及两个以上连续分组丢失恢复。发端部分采用K-Means算法对音乐信号分簇,结合音符起点位置信息生成发送者报告以TCP信道先导可靠传输;收端部分中对4种分组差错可能利用发送者报告进行信号重构。专业音乐人士的聆听评估测试验证了文中PEC方案较常规具有更高的MOS分及乐感体验。  相似文献   

19.
利用扫描电子声显微镜研究残余应力分布   总被引:1,自引:0,他引:1  
对材料中由塑性形变引起的表面及亚表面残余应力进行测定是材料科学及工程应用关注的重要问题之一。一种将扫描电子显微镜和声学技术相结合而研制成的扫描电子声显微镜技术(SEAM)可用于残余应力的定征,由此得到的电子声图象显示了在金属中由韦氏硬度压痕引起的残余应力的横向分布,并且利用扫描电子显微镜独特的分怪成象能力,揭示了残余应力的深度分布状况。此外,还讨论了扫描电子声技术定征残余应力的机理及实验条件对电子声信号的影响。  相似文献   

20.
混合调制信号调制识别方法   总被引:2,自引:0,他引:2  
研究基于决策理论算法的混合调制信号特征参数提取与自动识别技术,提出适合混合调制信号调制识别的树型分类器及相应识别步骤。在外调制、内调制识别时首次分别采用副载波信号个数构成的特征矢量、均值归一化包络方差、副载波信号瞬时幅度分布区域统计值等算法,抑制噪声干扰,提高特征参数的准确性,仿真结果表明,在信噪比为6 dB情况下,调制识别率接近90%,和现有混合调制识别方法相比取得较好的识别效果,在混合信号调制识别管理中具有广泛的应用前景。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号