首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 46 毫秒
1.
通过对同一首歌曲音频信号的特征分析,提出了一种基于音频片段平均短时能量和过0率标准偏差的融合判决方法.该方法解决了纯音乐与语音-音乐混合片段识别易混度高的问题,可以准确地识别同一首歌曲中纯音乐片段和语音-音乐混合片段,为去除音频中不需要的部分提供一种有效的预处理方法,并且可以更好地提高数据处理的效率和性能.实验结果表明,通过对不同风格、不同歌手以及不同语言的歌曲处理,纯音乐的平均正确率为92.30%,语音-音乐混合的平均正确率为96.36%.  相似文献   

2.
汉语语音识别中对孤立词、小词汇特定人的语音识别率较高,但对于连续的大词汇量语音识别率较差。把连续的大词汇语音实时自动地切分为单个音节,可以提高其系统的识别率。本文根据汉语语音在能量和频率等方面的特征,找到了短时平均幅度和短时平均过零率的方法来检测音节的端点,从而得到对文本文件中汉语语音的音节自动切分算法。  相似文献   

3.
音频信息的检索是多媒体检索技术中的一个重要方面。本文讨论一种基于音频信号的广告条目检索和定位的一种自适应方法,它利用短时平均过零率和互相关函数从实时音频数据流中快速检测和定位广告条目.  相似文献   

4.
提出了一种基于音频特征的自适应盲音频水印算法:使用Logistic混沌二进制序列对水印进行加密,通过对音频帧的过零率及短时能量的分析,选取适当的阈值,确定嵌入水印的帧,并对选定音频帧整合分段后进行小波变换,同时采用能量动态调整自适应确定嵌入强度的方法,计算每段音频的近似分量的平均能量,结合基础嵌入强度,得音频帧中嵌入水印.实验结果表明:该算法具有较好的鲁棒性和不可感知性,具有一定的实用性.  相似文献   

5.
语言是人类最重要的、最有效的、最常用的和最方便的通信形式。人们在与机器的信息交流中利用语音识别技术更加的方便、自然。语音识别中最基本的一些技术仍在不断发展。本文首先介绍了语音信号处理中端点检测的若干方法,着重分析了两种传统方法。而后简要介绍了它们的优劣和几种对它们的改进方法。最后提出了利用图像处理技术中的边缘检测技术进行语音端点检测的思路。  相似文献   

6.
藏语语音识别技术研究已成为当今一大热点,而端点检测则是语音识别预处理阶段的关键环节之一。文章以标准拉萨藏语为对象,通过将加窗、短时能量和过零率相结合的方法对藏语语音识别技术中端点检测的算法进行了研究。实验表明,采用上述三种算法相结合的研究方法对浊音较重的藏语语音识别较为合适,可显著提高识别率。  相似文献   

7.
提出了一种基于音频特征和逼近信号统计特征的零水印算法.实验结果表明,该算法能根据音频自身的特点寻找到适合用于嵌入水印的音频帧,实现水印信息的嵌入、提取和盲检测,在不改变听觉质量的同时降低了计算量,提高了水印的鲁棒性.  相似文献   

8.
蔡柳  赵晨星 《甘肃科技》2008,24(5):46-48
随着对安多藏语语音识别技术的研究,端点检测发挥着重要的作用,准确的判断语音端点对识别性能有很大的影响。引用了双门限检测法对藏语语音进行端点检测实验,在实验中对短时平均过零率进行修正,克服了随机噪音的影响,取得了较好的效果。  相似文献   

9.
计算机语音信号处理与语音识别系统   总被引:1,自引:0,他引:1  
对计算机语音处理和对单个数码字识别的实现进行了探讨。根据汉语语音的特点,以汉语单音字作为识别对象,对10个数码字识别进行了研究和实验。通过观察和分析语音信号的时域特性(主要是短时帧能量、短时过零率和帧能量差),并把它们应用于语音端点检测,为系统的建立做了基础准备。选用了语音信号的功率谱差的特征,进行了模板的建立与识别实验。测试结果表明,该系统性能较稳定,单个数码字识别率可达986%,说话人识别率达到922%。  相似文献   

10.
混合调制信号调制识别方法   总被引:2,自引:0,他引:2  
研究基于决策理论算法的混合调制信号特征参数提取与自动识别技术,提出适合混合调制信号调制识别的树型分类器及相应识别步骤。在外调制、内调制识别时首次分别采用副载波信号个数构成的特征矢量、均值归一化包络方差、副载波信号瞬时幅度分布区域统计值等算法,抑制噪声干扰,提高特征参数的准确性,仿真结果表明,在信噪比为6 dB情况下,调制识别率接近90%,和现有混合调制识别方法相比取得较好的识别效果,在混合信号调制识别管理中具有广泛的应用前景。  相似文献   

11.
为有效提高语音情感识别的准确性,达到人机和谐交互的目的,本文提出了一种基于决策树和改进SVM混合模型的语音情感识别方法,有效地避免了无界泛化误差、分类器数目多、受限优化等问题,提高了悲伤、喜悦、愤怒、厌恶、惊讶、恐惧6种基本情感识别效率。实验结果表明,该方法识别准确率为87.58%,与传统的支持向量机和人工神经网络方法相比,有更高的抗噪声能力和稳定性,能得到更高的识别准确率,而且有较强的实用性和推广能力。   相似文献   

12.
音频音乐信号的特征分析具有广泛的应用前景,如音乐检索、乐器识别等。本文先引入贝叶斯节奏模型,然后用基于贝叶斯理论的序列蒙特卡罗方法,推断音乐片段的小节和节拍的位置。对不同乐器演奏的、不同音乐速度的、不同节奏模式的音乐,本方法均能有效地提取节奏特征。  相似文献   

13.
研究了用于CHMM的MCE学习方法,提出了简单形式的识别函数、误差函数、扣池数等的定义方法以及总损失函数的最小化方法。通过对非特定人汉语连续语音识别实验,证明了提出了的函数形式和损失函数最小化方法对CHMM的MCE学习的有效性。  相似文献   

14.
音乐与情感有着非常密切的联系,发展针对音乐的情感识别系统,对于计算机音乐的研究与发展有着深远的意义.提出了一种基于PAD(Pleasure arousal dominance)模型以及基因表达式编程(GEP)算法的音乐情感自动识别方法.在众多音乐特征元素中抽取与情感关系密切的6个特征,并且采用PAD模型来描述音乐中的情感,在此基础上使用GEP算法实现对简单乐曲中单一情感的自动识别.从实验结果分析,本系统能够达到一个比较理想的识别效果和较低的识别误差.  相似文献   

15.
讨论了音乐识别领域中音高的三种不同的识别方法,即时域的并行处理法、频域的谐波峰值法以及时频域的小波算法。通过实例和分析,比较了各种方法的优缺点。  相似文献   

16.
本文介绍亍脉动阵列算法的原理,给出了语音识别中进行模式匹配使用的动态规划算法和概率匹配算法的实现。这种结构对实时的大词汇量的孤立词或连续语音识别是十分有效的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号