首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 318 毫秒
1.
目的构造音乐情感分类器,为计算机理解情感提供途径。方法首先分析现有音乐情感模型,然后提取音乐情感特征并采用神经网络构造音乐情感分类器,最后采用相关反馈对分类结果进行标注并进一步训练分类器,直至训练样本的错误分类率在一定误差范围内。结果对测试样本进行情感分类,达到了最高89%的分类准确率,实现了音乐情感分类器的构建和音乐片断的情感标注。结论研究成果是音乐情感检索的基础工作,也可用于其他音频的情感识别和分类。  相似文献   

2.
基于变分辨率频谱特征的向量机静音检测和实时混音技术   总被引:1,自引:0,他引:1  
静音检测算法基于两个语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重.测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729B静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729B静音检测算法的视频系统.  相似文献   

3.
音频分类是音频信号处理中一项重要的预处理工作.该文描述了一种基于能量的分类方法,将音频信号分为语音和音乐2种类型.分类的过程分为3个阶段,首先计算优化低能量率MLER(modifiedlow energy ratio)作为特征,然后利用初级分类器得到初步分类的结果,最后利用音频类别的前后相关性,使用上下文分类器修正初始分类得到最终分类的结果.该文重点对MLER中参数的合理选取范围进行了讨论,并对传统的初始分类器作了改进,用非参数分类器和参数分类器代替原有的Bayes硬判决的方法,避免了由于门限选择不当所带来的分类错误.实验表明,使用参数分类器时,对纯语音和纯音乐分类效果很好,正确率达99%以上.  相似文献   

4.
心率变异性分析是最常用的一种基于心电信号的疲劳驾驶检测方法.然而,该方法需要被检测信号时间足够长,且准确率较低.因此提出一种基于短时心电信号的疲劳驾驶检测算法.首先,按照30s的时长截取短时心电信号序列,利用差分阈值法确定R波位置,根据R-R间期差值大小剔除不合格的噪声样本;然后,计算R-R间期序列的时域/频域特征并与利用ImageNet数据集预训练的深度卷积神经网络模型提取的特征相结合;最后,设计了一种随机森林分类器并基于这些特征进行分类.结果表明,该算法在疲劳驾驶检测上具有良好的分类效果,平均准确率达到91%.因此,相较于心率变异性分析方法,本算法检测所需心电信号更短,且在准确率上具备显著优势.  相似文献   

5.
通过对同一首歌曲音频信号的特征分析,提出了一种基于音频片段平均短时能量和过0率标准偏差的融合判决方法. 该方法解决了纯音乐与语音-音乐混合片段识别易混度高的问题,可以准确地识别同一首歌曲中纯音乐片段和语音-音乐混合片段,为去除音频中不需要的部分提供一种有效的预处理方法,并且可以更好地提高数据处理的效率和性能. 实验结果表明,通过对不同风格、不同歌手以及不同语言的歌曲处理,纯音乐的平均正确率为92.30%,语音-音乐混合的平均正确率为96.36%.  相似文献   

6.
提出一种基于隐马尔可夫模型和支持向量机混合模型的音频分类方法,用于语音、音乐、语音+音乐、静音4类音频分类。首先利用4个HMM分类器对音频进行初步分类,确定最可能的两种音频分类结果,再用相应的SVM分类器做最终判决。实验结果表明,隐马尔可夫模型和支持向量机的两级分类器分类性能较好。  相似文献   

7.
针对网络视频的监管需求,提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口(MPEG 7)音频特征(包括音频频谱质心,音频频谱带宽等低层音频特征.)及MPEG 7高层特征——音频签名,来构造每段视频特有的音频词汇,采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中,对于不同音频词汇量采用了独特的词汇权重分配机制,同时借助特有的针对暴力视频的分类策略,以提高分类效果.通过3组实验,对不同的音频特征的准确率、不同词汇的分类效果、以及对视觉特征粗分类的精确分类进行了研究.实验结果表明,该方法有较好的查全率.  相似文献   

8.
提出针对广播和航空语音信号的f-kmd融合聚类方法,对2种信号语音数据进行分段,提取每段短时语音数据的均值、方差、平均过零率、平均短时能量、归一化峰度和振幅指标等语音信号的基本特征进行归一化处理,利用模糊c均值聚类(FCM)方法对特征数据进行聚类分析,获得短时分段后的语音信号聚类结果,再对分段后的聚类结果整体上进行K-Medoids聚类分析,得到两类信号的聚类中心。实验表明,融合聚类方法能较好地对广播和航空语音信号进行分类,分类准确率较高,结果较稳定。  相似文献   

9.
针对关联分类算法产生的规则普遍存在分类器分类精度、效率低的问题,提出了一种提取有效规则的关联分类算法--ACDER算法.首先定义了剩余支持度和剩余置信度,然后通过计算规则剩余支持度和剩余置信度建立了分类器并进行剪枝,以达成对分类尽量少且最有效的规则构成分类器,确保分类器中不存在任何冗余规则和冲突规则.在8个数据集上的测试结果表明,所提算法的平均分类精度比关联规则算法提高了4.15%,而在所有数据源分类器上的规则数却减少了54%.  相似文献   

10.
采用同一种特征参数——Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频之间的差异,给出了一种区分性模型训练和特征筛选相结合的多级二分类音频分类方法,即为各级建立GMM(Gaussian mixture model)模型的同时挑选出使当前模型区分程度达到最大的特征子集.对长约2 h的音频数据集的测试结果表明,该方法相对于特征筛选前的分类系统,平均误识率下降了约23.5%,且各二分类子系统的特征维数也有明显地减少.  相似文献   

11.
对语音的浊/清分类方法进行了讨论,并着重研究了基于多个特征参数、应用模式识别理论的语音分类系统.实验表明,采用Fisher分类器实现的语音分类方法,对训练内语音分类准确率可达98.6%,而训练外语音分类准确率也可达96.7%.  相似文献   

12.
针对现有的音频认证算法音频格式单一、算法不通用、认证效率低的问题,提出一种基于能零比的多格式音频感知哈希认证算法.该算法首先对待认证音频进行预处理、分帧和加窗,并计算每帧信号的短时能量和短时过零率,获得每帧信号的短时能量和短时过零率的比值;然后将获得的短时能量和短时过零率的比值作为音频信号的感知特征值;最后对感知特征值进行哈希构造,生成感知哈希序列.为提高算法的安全性,算法采用与哈希序列等长的密钥对哈希序列进行置乱.仿真结果表明:该算法对原始域和压缩域五种不同格式的音频内容都具有较好的鲁棒性和区分性,认证效率高.  相似文献   

13.
针对传统的分类器融合存在的诸多问题,提高情感检测正确率,采用双模态(音频、视频)参数提取,选择差异性强的组合小波神经网络(MWNN)与混合高斯模型(GMMs)分类器.在语音韵律、音质特征与人脸几何特征提取后,对提取后的特征用主元分析法(PCA)进行降维,对分类器进行匹配化输出,最后引入GA算法来搜索最优的融合系数向量,充分发挥各分类器本身对特定情感的敏感特性.实验证明,与传统的融合算法相比,经匹配化的GA融合算法将识别率提高了4%~10%,具有更高的识别率与更强的泛化能力.  相似文献   

14.
语音信号识别系统预处理阶段中一个关键步骤是语音信号的端点检测,其精准性直接决定了整个语音识别系统的识别效果. 传统的短时能量和短时过零率双门限检测法中后端点检测存在偏差,且在有噪声的情况下鲁棒性较差. 从动态阈值、短时平均过零率、端点修复、动态检测等方面入手,改进了双门限检测法. 优化了的端点检测算法,使得语音识别系统能够更精确地识别和提取语音,减少了语音识别时间,提高了识别率. 进一步将无用信号和语音信号完全分离开来,有利于后续语音识别的研究.  相似文献   

15.
提出一种基于向量空间模型(VSM)的音频分类算法.特征提取中,针对目前采用的参数主要为静态特征,提出了基于信息论的动态特征计算方法,并根据其物理意义设置关键帧提取中的初始值,解决聚类局部极值问题.通过引入音频聚类的类内标准差,对传统VSM未处理特征项间相关信息的缺点进行改进,提出新的相似性度量方法,并以此方法对不同类别的音频构造分类器.实验结果证明,此方法提高了分类精度,准确度可达85%以上.  相似文献   

16.
针对传统虹膜分类需手工设计滤波器提取虹膜特征,提取特征单一,且通常需大量手工调参,泛化能力较差的问题,提出一种面向残差网络下多元特征的虹膜分类算法.一方面将虹膜图像与Gabor特征相结合,另一方面在网络结构中使用多个尺度的卷积核,使学习到的虹膜特征更丰富,从而提高图像特征的表征能力.实验结果表明,在固定类别中,使用Softmax分类器进行多分类,该算法在JLU虹膜数据库中的分类准确率可稳定在98.90%以上,不低于DeepIrisNet和Resnet等网络结构,且该算法的网络结构参数更少,学习速度更快.  相似文献   

17.
为解决传统音乐情感分类特征单一,导致训练效果差的问题,提出了一种多模态注意力融合网络模型,首先将执行情感分类使用的歌词和音频分离,将上下文特征提取方法与分类器相结合,从而提高特征提取效率;其次通过注意机制融合多模态特征,从而加快模型训练效率及情感分类准确率;接着提出了一种自适应孤立森林噪声方法增强模型对不均衡样本的适应性,并在一定程度上缓解模型过拟合问题.最后,将模型与LSTM、GRU、BI-LSTM、BI-GRU等模型进行仿真比较,结果表明所提模型性能最优,情绪分类准确率可达96.46%.  相似文献   

18.
基于MFCC和GMM的个性音乐推荐模型   总被引:1,自引:1,他引:0  
提出一种基于Mel频率倒谱系数(MFCC)和高斯混合模型(GMM)的个性音乐推荐模型的建立方法.该方法采用MFCC技术提取歌曲的语音特征,并利用GMM算法生成该歌曲的模板,然后利用音乐模板库对音乐文件进行相似度计算.实验结果表明,利用该模型为用户推荐的歌曲平均准确率为90%.  相似文献   

19.
【目的】针对标准协同训练中视图分割不充分冗余导致两个分类器误差累积加大,且两个分类器对同一个未标记样本分类不一致的问题,提出了结合信息增益率和K-means聚类的协同训练算法。【方法】该算法先根据有标记样本计算出数据中每一个特征的信息增益率,将信息增益率高的特征平均划分到两个视图,再在每次分类过程中应用K-means聚类确定标记不一致样本点的最终类别。【结果】通过在9个UCI数据集上的3组实验表明,与对比算法相比,所提算法中两视图分类器的平均正确率差值降低了2.9%,有效均衡了分类器性能,同时在分类准确率和算法稳定性上也有较大提升。【结论】利用信息增益率将关键特征均衡划分到两个视图,有效解决了视图分割不充分冗余问题;K-means聚类重新分类标记不一致的样本,降低了样本被误分类的概率。  相似文献   

20.
针对现有评价方法需人工提取特征且评价准确率低的问题,提出基于反向传播(BP)算法的深度堆栈编码器(SAE)网络的学生综合能力评价方法.通过SAE网络对输入的学生各项指标成绩进行无监督训练,将SAE学习到的特征结合相应的样本标签,利用柔性最大值分类器(Softmax)进行有监督式分类.采用BP算法进行反向传播调整隐层权重,优化整个模型,以避免过拟合现象的发生.结果表明:该评价方法有利于解决需对传统神经网络进行人工提取和分析特征的问题,可提高评价结果的准确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号