首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 453 毫秒
1.
基于人工神经网络的音乐和弦感知   总被引:1,自引:0,他引:1  
和弦的感知是音乐自动标注的基础,对于音乐结构分析及旋律分析等任务有重要的作用,因此成为音乐信息检索(M IR)领域的热点之一。本文根据音乐认知心理学原理,提出一种基于人工神经网络(ANN)的和弦实时感知方法:首先利用常数Q变换(CQT)对音乐信号进行时频变换,并在所得到的谱上实施音符起始点检测、音高校准及基频分析等技术以增强系统的鲁棒性,之后定义了一种全新的音级分布矩阵(PCDM)特征,最后利用ANN模拟人脑认知过程并通过半监督学习方法对和弦进行感知。在多种风格音乐上进行的初步实验表明,所提出的方法以可以接受的计算时间消耗取得接近60%的识别率,与本领域先进方法的效果不相上下。  相似文献   

2.
光学乐谱识别是音乐信息检索中一项重要技术,音符识别是乐谱识别及其关键的部分.针对目前乐谱图像音符识别精度低、步骤冗杂等问题,设计了基于深度学习的端到端音符识别模型.该模型利用深度卷积神经网络,以整张乐谱图像为输入,直接输出音符的时值和音高.在数据预处理上,通过解析Music XML文件获得模型训练所需的乐谱图像和对应的标签数据,标签数据是由音符音高、音符时值和音符坐标组成的向量,因此模型通过训练来学习标签向量将音符识别任务转化为检测、分类任务.之后添加噪声、随机裁剪等数据增强方法来增加数据的多样性,使得训练出的模型更加鲁棒;在模型设计上,基于darknet53基础网络和特征融合技术,设计端到端的目标检测模型来识别音符.用深度神经网络darknet53提取乐谱图像特征图,让该特征图上的音符有足够大的感受野,之后将神经网络上层特征图和该特征图进行拼接,完成特征融合使得音符有更明显的特征纹理,从而让模型能够检测到音符这类小物体.该模型采用多任务学习,同时学习音高、时值的分类任务和音符坐标的回归任务,提高了模型的泛化能力.最后在Muse Score生成的测试集上对该模型进行测试,音符识别精度高,可以达到0.96的时值准确率和0.98的音高准确率.  相似文献   

3.
歌唱声音的自动标注是基于内容的音乐分析和检索领域的基础问题。该文在统计分析汉语歌唱声音声韵母时长和音高特征的基础上,提出了一种声乐自动标注模型。该模型将信号处理、语音学和音乐知识结合,通过韵母-乐谱音高对齐和基于声母时长分布的边界优化算法实现了高精度的音符切分。音高提取算法在移调检测的基础上,通过限定基音周期搜索范围的策略克服了信号频谱中半频/倍频点的干扰。结合音乐教学实践,通过检测音符内部最稳定音高成分、估计演唱速率和归一化音符时长的方法提取歌唱声音的音高、节奏和时长信息,并基于这3个客观物理量提出了一个视唱评价方法。实验表明,该文提出的算法能够准确地标注歌唱声音中的音符边界(平均误差26ms)和音高(平均误差0.23半音)。  相似文献   

4.
耳鸣是在无外界声源刺激下的一种主观感知,在临床上十分常见.习服治疗是目前公认的一种有效的耳鸣治疗方法.研究表明,具有相似却又不重复的分形音乐可以作为耳鸣习服治疗的治疗声源.本文提出了一种基于IFS(Iterated Function System)分形算法和分解和弦的耳鸣康复音合成新方法,该方法将分形图形处理技术运用到耳鸣康复音的合成中,使得生成的音符整体在可控范围内随机出现,并且相邻音符在可调节的范围内波动,可有效的避免音调突变现象.此方法保留了图像信号中的分形特征,实现了可控范围内的确定性与可预测性的统一;在加入了分解和弦后,音乐更加连贯.试听结果表明,该耳鸣康复音具有相似不重复、流畅且突变少的特点,对耳鸣治疗有一定的参考价值.  相似文献   

5.
在平面构成这个富与智性美的视觉体系内,纯粹而又基本的造型元素主要是点、线、面.它们好比音乐中的七个基本音符那样,一经被谱成乐曲就魅力无穷.  相似文献   

6.
研究了长时音乐持续刺激下,人脑对音乐属性变化加工规律的脑反应,结合音乐的底层属性特征与事件相关电位(ERP),研究音乐相关的脑反应机制.首先,通过一个长时音乐的脑认知实验来采集需要的脑电信号.随后,提取了音乐的几种属性特征——频谱通量、过零率和均方根可近似代表音色、音高和音强3种要素.对于得到的声音特征信号,提取了特征信号上的突变点作为ERP叠加的事件点,并据此将16首音乐的事件点进行了叠加平均,通过得到的ERP图像,作了相应的脑地形图.最后,初步得到结论:前额区和中央区在脑对音乐的反应中所占比重较大,并且脑对音高变化反应最为强烈.本文所采用的研究思路,将音乐特征作为事件,进而探究脑认知规律.经过验证,这种方法可以广泛应用于相关脑认知研究.  相似文献   

7.
音乐情感识别是音乐检索的一个重要组成部分.基于音乐声学特征分析,尝试提取代表音乐声学特性的时域、频域、倒谱域的各种特征,并利用支持向量机(support vector machine,简称SVM)算法对中文音频进行情感分类,以研究不同特征组合在音乐情感分类上的效果.通过对比各种不同特征组合的音乐情感识别效果,发现由4个时域特征、频谱、幅度谱和相位谱组成的音乐特征对中文音乐情感分类的效果良好.  相似文献   

8.
杨光 《科技信息》2012,(25):184-184
音符(音乐)是开启人类智慧大门的一把钥匙。如果学生缺乏必要的音乐素质,音乐的美感就不能为学生所接受,音乐本身就会黯然失色,音乐教学就不能最终取得成功。因此在教学中不仅要教会学生音乐理论知识、音乐基本技巧,而且要在培养和提高学生音乐素质上多下功夫。  相似文献   

9.
临近空间高超声速目标断续点迹航迹起始方法   总被引:1,自引:0,他引:1  
针对雷达探测临近空间高超声速目标受到雷达散射截面(RCS)随照射姿态异常分布、目标高速高机动飞行和大气环境等的影响,容易出现断续点迹,导致航迹起始困难的问题,提出了一种基于并行流水线的可变波门航迹起始方法.通过分析传统航迹起始方法存在的问题,结合临近空间高超声速目标的机动特性,设计了针对性更强的相关波门,采用流水线思想,并行执行针对不同周期出现断续点迹的航迹起始进程,实现多目标断续点迹的航迹起始.蒙特卡罗仿真结果表明:新方法正确航迹起始概率高,虚假航迹起始概率低,计算量小,具有一定工程实践性和可推广性.  相似文献   

10.
根据PLC脉冲输出指令和算术应用类指令,研究了利用PLC实现音乐播放器功能问题.分析了乐谱音高及音长的编码方法和存储方式,采用PLC间接寻址方式实现音符编码的读取功能,应用算术指令实现解码功能,应用SPED指令实现不同音符的对应频率输出功能,应用PULS指令实现不同音长和节拍的控制功能.  相似文献   

11.
本文提出了一种基于弦乐配器的音乐隐写方法.首先,通过音乐中每个音符的时值和节拍力度选择可以用于嵌入秘密信息的音符位置;然后,在嵌入过程中,以和弦为基本单位,通过秘密信息调制其中不同类别音符的比例.此外,本文通过盲听测试对模型进行相关的评价,理论分析和实验结果表明本文的方案可以在保证嵌入透明性的同时实现不错的隐藏容量和很好的安全性.  相似文献   

12.
针对目前视觉定位方法大多基于地面语义特征(如车道线、停车线等)容易受到其他地面语义特征(如箭头、斑马线等)的影响,提出了一种基于地面快速鲁棒特征(SURF)点的全局定位方法.该方法首先在鸟瞰图中检测SURF点,结合高精度GPS构建地面SURF地图.然后在此基础上,使用迭代最近点算法,将在线检测结果与地图匹配获得车辆全局定位,并通过扩展卡尔曼滤波将定位结果与惯导和里程计数据进行融合,提高全局定位精度.实验结果表明,所提出的方法可获得分米级定位结果,能满足智能车的定位需求.  相似文献   

13.
音乐与情感有着非常密切的联系,发展针对音乐的情感识别系统,对于计算机音乐的研究与发展有着深远的意义.提出了一种基于PAD(Pleasure arousal dominance)模型以及基因表达式编程(GEP)算法的音乐情感自动识别方法.在众多音乐特征元素中抽取与情感关系密切的6个特征,并且采用PAD模型来描述音乐中的情感,在此基础上使用GEP算法实现对简单乐曲中单一情感的自动识别.从实验结果分析,本系统能够达到一个比较理想的识别效果和较低的识别误差.  相似文献   

14.
文中针对图像篡改中最常见的复制粘贴篡改被动取证问题展开图像分析研究,提出了一种基于仿射尺度不变特征变换(ASIFT)和圆投影特征的算法,用于检测图像中是否存在复制粘贴篡改.实验结果表明:基于仿射尺度不变特征的算法对具有明显角点特征的篡改图像的取证效果较好,而基于改进圆投影特征的算法对不具备明显角点特征的篡改图像(如随机性纹理、平坦区域)的取证效果较好,因此联合使用基于这两种特征的算法对常见的复制粘贴型图像篡改进行被动取证能达到较好效果.  相似文献   

15.
工尺谱是现存数量最多的中国传统乐谱.今人解读工尺谱的最大难点在于处理不确定的节奏型,即工尺谱只规定了节拍的起始位置,并未对音符的具体时值进行分配.本文探讨了工尺谱自动翻译成五线谱的必要性与合理性,并提出了一种基于时间序列分析的自动翻译模型.实验中,该模型的正确率为88.25%,与隐马尔可夫模型和条件随机场模型相当,并且能够避免OOV(Out Of Vocabulary)问题.本文的自动翻译模型,并非旨在代替人工翻译,而是希望将人的经验通过数据的形式,建立起可重复使用并不断更新的统计模型,从而使得中国传统音乐的实践经验得以更便捷地传承下去.  相似文献   

16.
利用"现代维吾尔语语音声学参数库",对维吾尔语清塞音[q]的单音节、双音节、三音节、多音节中男性(M2)和女性(F2)的无声间隙(GAP)、嗓音起始时间(VOT)、时长(CD)、音强(CA)、共振峰(F)等不同音节中的声学特征进行统计和声学分析,找出维吾尔语清塞音[q]在不同音节中的不同声学特征.本研究对维吾尔语教学、语音识别和语音合成有一定的理论基础和应用价值.  相似文献   

17.
图像特征提取是图像匹配和三维信息提取的基础,是影像分析与单像处理技术领域中最重要的任务之一.有效的特征提取算法是影像分析与处理的关键.基于特征的图像配准中,特征主要针对点特征.基于点特征的图像配准,特征点的提取是图像配准的关键步骤,本文从点特征定义出发,分析和研究了几种常用的点特征提取方法,如:Moravec算子、Harris算子、SUSAN算子、Forsmer算子等,最后得出一些有益的结论.  相似文献   

18.
随着互联网以及社交网络的发展,电子相册逐渐成为应用广泛的基础服务之一,而如何提高相册的用户体验变得尤为重要.本文提出基于情感的家庭音乐相册自动生成研究,旨在解决为用户喜爱的音乐自动推荐与其情感表达相近的相册图片问题.本文从音乐和图像蕴含的情感出发,音乐上选取梅尔频率频谱系数(MFCC)和相关谱感知线性预测(RASTA-PLP)特征,图像上选取比较直观的颜色特征.在算法上使用了核化典型相关分析(KCCA)方法,该算法解决了图像特征与音乐特征之间异构和跨模态的特征融合问题,实现了音乐相册的自动生成.在实验中,客观评测结果表明,采用KCCA方法在查准率方面高于纯CCA方法;在主观评测中KCCA获得69.45%的满意度,与人工推荐的评价结果(78.09%)比较接近,高于随机推荐和CCA方法的满意度.  相似文献   

19.
介绍音乐软件 Sibelius的一些实际应用 .Sibelius做为一款出色的音乐软件 ,会给我们的音乐学习、音乐交流带来非常大的帮助 .在 Sibelius介绍部分对 Sibelius软件做了简要介绍 ,包括音符输入、播放、运行环境等 ;Sibelius应用部分描述了 Sibelius在不同方面的一些应用 ,比如乐谱制作、音乐辅助教学、互联网发布、电子有声音乐图书、作曲辅助等 ;最后对 Sibelius应用的意义与价值做了简要概括 .通过本文 ,可以初步了解关于应用音乐软件 Sibelius进行音乐教学的一些情况 .Sibelius做为一款音乐软件 ,虽然制谱是其最主要的功能 ,但通过 Sibelius输出为网页形式的乐谱 ,则可以应用到音乐教学、音乐有声刊物出版、作曲等各个方面  相似文献   

20.
随着动作捕捉技术的发展,基于音乐的舞蹈生成技术逐渐成为一大研究热点,而如何提高音乐和舞蹈的匹配以及舞蹈生成的真实性是研究的关键点.本文提出的基于过渡帧插值的音乐驱动舞蹈合成,旨在解决为音乐合成与其局部节奏和强度匹配且衔接自然的舞蹈动作问题.为了充分挖掘音乐和舞蹈的局部相关性和提高生成舞蹈的丰富性,先对目标音频分段,然后对音乐片段和动作数据库中已有的动作片段进行特征匹配分析,最后对和目标音乐片段特征匹配的动作片段进行过渡帧插值衔接.本文提出的过渡帧插值算法,使插值后的动作同时保留前一帧动作和后一帧动作的特征,避免动作突变,从而实现自然过渡.另外,提出一种音乐驱动舞蹈合成的框架,包含音乐和动作的共同特征提取、特征匹配分析和动作片段的插值衔接.音乐和动作的共同特征提取从节奏和强度出发,特征匹配分析利用节奏点的同步程度和强度分布的相似性.实验结果表明:本文提出的算法能合成逼真的舞蹈动作,具体合成舞蹈视频在项目网站上呈现.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号