首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
针对语音/音乐分类过程中由于特征参数提取过多造成的维数灾难及分类准确率有待提高等问题,提出了一种基于过零率及频谱的语音/音乐分类算法.该算法在对语音及音乐2类信号进行端点检测及分段预处理后,结合每一音频段的过零率和频谱幅值特性进行分类识别处理,最后通过计算被判别为语音或音乐的概率实现分类.实验结果表明,此算法在音频分类中较同样最多只提2个音频特征且未用分类器算法的准确率平均提高约7.9%,较提取多个音频特征且采用分类器算法的准确率平均提高约5.7%.证明了该算法不仅计算量小,且分类准确率也有所提高.  相似文献   

2.
采用同一种特征参数——Mel倒谱系数及其动态参数区分纯语音、带背景语音、乐器音、歌声和环境音.根据该特征参数的特点以及各类音频之间的差异,给出了一种区分性模型训练和特征筛选相结合的多级二分类音频分类方法,即为各级建立GMM(Gaussian mixture model)模型的同时挑选出使当前模型区分程度达到最大的特征子集.对长约2 h的音频数据集的测试结果表明,该方法相对于特征筛选前的分类系统,平均误识率下降了约23.5%,且各二分类子系统的特征维数也有明显地减少.  相似文献   

3.
基于小波变换和支持向量机的音频分类   总被引:1,自引:0,他引:1  
音频特征提取是音频分类的基础,而音频分类又是基于内容的音频检索的关键。使用小波变换和支持向量机的方法对音频进行分类。研究了小波变换域的音频特征提取,分析了这些特征在小波变换域中的意义。把得到的特征向量作为支持向量机的输入,把音频分成纯语音、带背景音乐的语音、音乐、环境音4种类型。实验结果表明,基于小波域的特征计算简单、能够较好地区分不同的音频类型,得到较高的分类精度。  相似文献   

4.
针对视频信息具有的多模态性质,提出了融合视音频多种模态特征信息的视频融合分析框架,用以提高视频检索的正确率和效率.该框架根据从视频底层提取出的多种图像特征、音频特征,采用基于图嵌入框架的降维算法MFA降维,根据降维后得到的各种特征向量,训练SVM分类器进行分类,并用改进后的MGR融合算法对SVM分类器输出的序号矩阵进行融合分析.实验结果表明该融合框架融合多种特征提高了分类识别的效率,采用了改进的融合算法降低了计算复杂度,提高了系统的整体性能.  相似文献   

5.
为了提高音频数据分类正确率,提出一种通过非负张量分解(NTF)的分类方法.音频信号经过预处理后,提取声学特征和感知特征参数,然后构建非负的3阶音频张量,其各阶分别对应特征、帧、样本;其次,通过NTF得到每一类音频的核张量与因子矩阵,让测试样本构建的张量与各类型音频的因子矩阵的转置进行张量乘,得到对核张量的近似;最后,通过Frobenius范数进行相似性度量,完成分类.使用古典音乐、流行音乐、语音、噪声4种类型的音频数据测试分类效果.结果表明,平均分类正确率在85%,以上,说明该方法可以有效地完成音频分类.  相似文献   

6.
基于变分辨率频谱特征的向量机静音检测和实时混音技术   总被引:1,自引:0,他引:1  
静音检测算法基于两个语音感觉特征与变分辨率频谱的Mel频率倒谱系数组合成音频特征,采用多门限过零率对静音进行初判,并通过二分类支持向量机对组合语音特征进行分类;实时混音算法使用每一路音频的短时能量作为混音权重.测试表明,静音检测算法在不同信噪比下语音识别正确率高于G.729B静音检测算法;实时混音算法听觉测试优于传统的算法,并且混音计算延时低,满足网络实时传输的要求;两种算法同时应用于视频会议系统,视频会议服务器的运算量低于使用了G.729B静音检测算法的视频系统.  相似文献   

7.
针对网络视频的监管需求,提出了一种基于音频词袋的暴力视频分类方法.采用提取视频中音频流的多媒体内容描述接口(MPEG 7)音频特征(包括音频频谱质心,音频频谱带宽等低层音频特征.)及MPEG 7高层特征——音频签名,来构造每段视频特有的音频词汇,采用该音频词汇出现的频率形成音频词袋特征.采用支持向量机对暴力和非暴力视频进行分类.把词袋模型应用到暴力音频特征分类中,对于不同音频词汇量采用了独特的词汇权重分配机制,同时借助特有的针对暴力视频的分类策略,以提高分类效果.通过3组实验,对不同的音频特征的准确率、不同词汇的分类效果、以及对视觉特征粗分类的精确分类进行了研究.实验结果表明,该方法有较好的查全率.  相似文献   

8.
研究了音频信息隐藏技术中的"知彼"问题——掩密分析方法。该算法首先对含密音频进行小波去噪处理,然后进行滑动相关计算,最后利用小波突变点检测技术提取特征对待分析的音频进行分类,该算法检测性能具有只受秘密信息嵌入强度影响而与嵌入容量无关的特点。实验结果表明,含密音频中PN序列嵌入强度越大,检测的正确率越高。特别在嵌入强度只有0.002时,算法的检测正确率仍然达到了80%以上,因此,算法具有良好的检测性能。  相似文献   

9.
提出了一种基于音频特征和逼近信号统计特征的零水印算法.实验结果表明,该算法能根据音频自身的特点寻找到适合用于嵌入水印的音频帧,实现水印信息的嵌入、提取和盲检测,在不改变听觉质量的同时降低了计算量,提高了水印的鲁棒性.  相似文献   

10.
在基于S IP的多媒体会议系统环境下,设计了一种自适应衰减的混音算法,并将该算法在VC环境下编程实现.测试结果表明:该算法能够有效地解决多用户下的音频溢出等问题,可提高语音质量,满足会议的要求.  相似文献   

11.
基于内容的音频自动分类方法   总被引:1,自引:1,他引:1  
为了解决基于内容的音频检索、语音文档检索等很多领域中提取音频结构和内容语义的问题时,介绍几种比较典型的音频分类算法包括最小距离方法、支持向量机、神经网络、决策树方法等,指出在基于内容的音频检索技术方面的难点以及发展方向.  相似文献   

12.
卷积神经网络模型作为音频特征提取器具有较好的应用效果,但该类模型的训练过程对数据量要求比较高。针对这一问题,本文提出一种基于双重数据增强策略的音频分类方法。首先采用传统音频数据增强方法(旋转、调音、变调、加噪),并将增强后的数据转化为语谱图,再采用随机均值替换法进行谱图增强。在此基础上训练Inception_Resnet_V2神经网络模型作为音频特征提取器,最后训练随机森林模型作为分类器完成音频分类任务。实验结果表明,与已有方法相比,采用双重数据增强策略可明显提升音频分类精度,并且训练出的特征提取模型具有较强的泛化能力。  相似文献   

13.
支持向量机在大类别数分类中的应用   总被引:24,自引:0,他引:24  
研究支持向量机在大类别数分类中的应用;结合二叉决策树的基本思想提出一种基于支持向量机(support vector machine,SVM)的大类别数分类解决方法,即SVM决策树方法,对不同背景下可选用的SVM决策树的结构进行了讨论,分析了SVM决策树的特点,并对其识别错误率进行数学进行,结果表明该方法可降低平均分类错误率,对实际应用中的多类分类问题提供新的途径。  相似文献   

14.
提出一种基于隐马尔可夫模型和支持向量机混合模型的音频分类方法,用于语音、音乐、语音+音乐、静音4类音频分类。首先利用4个HMM分类器对音频进行初步分类,确定最可能的两种音频分类结果,再用相应的SVM分类器做最终判决。实验结果表明,隐马尔可夫模型和支持向量机的两级分类器分类性能较好。  相似文献   

15.
机器人足球决策软件系统研究与实现   总被引:3,自引:0,他引:3  
在机器人足球比赛中,决策系统根据视觉系统提供的机器人位姿和足球位置信息,进行快速准确的决策,是取得胜利的关键。介绍了一套机器人足球决幕软件系统的设计实现方案,采用六步推理模型,基于敷组对称和按需首次计算的视觉信息预处理方法;提出基于角色的改进多参考点运动轨迹规划方法。通过实际比赛验证,达到了机器人足球比赛要求,比赛效果较好。  相似文献   

16.
一种新的 SVM 决策树   总被引:3,自引:0,他引:3       下载免费PDF全文
SVM在小训练样本、高维情况下具有很好的泛化性能,但它不适用于多类分类.本文分析基本的SVM和多类SVM分类器,重点讨论了SVM决策树,提出了一种结点分类器类集合划分方案来构造SVM决策树.实验结果表明,以这种方法构造的SVM决策树分类器分类性能较好.  相似文献   

17.
提出一种改进随机子空间与C4.5决策树算法相结合的分类算法.以C4.5算法构建决策树作为集成学习的基分类器,每次迭代初始,将SMOTE采样技术与随机子空间方法相结合,生成在特征空间和数据分布上差异明显的合成样例,为基分类器提供多样化的平衡训练数据集,采用绝大多数投票方法进行最终决策的融合输出.实验结果表明,该方法对少数类和多数类均具有较高的识别率.  相似文献   

18.
选择昆明市作为研究区,以2011年LandsatTM影像为基础数据,通过分析研究区地形特征,提出把研究区进行分区并分别确定高程、坡度决策规则的改进型决策树分类方法,并结合分析的光谱特征规律,在决策分类中引进了比值型指数、NDVI值,构建基于光谱特征和地学辅助知识的决策树信息提取模型,最后对传统计算机自动监督分类方法与决策树信息提取模型方法解译的昆明市土地利用数据的精度进行评价。研究结果表明:基于改进的决策树分类方法进行遥感信息提取的昆明市土地利用数据的Kappa指数比传统监督分类方法提高了0.234,分类精度提高了17.03%;从各种地类类型的测试样本点平均正确率来看,改进的决策树分类方法比传统监督分类方法提高了21%,大大提高了LandsatTM遥感数据分类的精确度和可靠性。  相似文献   

19.
以足球机器人系统为实验平台 ,针对移动机器人智能决策中的实际问题 ,提出了一种基于径向基函数神经网络的机器人行为决策方法 ,通过神经元学习和训练以及自身的泛化能力 ,可以很好地利用多源信息进行机器人行为决策 ,以提高行为决策的有效性 .同时为了保证行为决策的实施效果 ,将模糊推理技术与传统的PID控制相结合 ,既保证了移动机器人系统运动控制的准确性和稳定性 ,又缩短了动态调整时间 ,取得了较好的控制效果 .  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号