首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 234 毫秒
1.
提出了采用模糊有向图支持向量机(FDGSVM)对基于输出的多语言语音样本进行语音质量评价的一种新方法.将多个可进行两类分类的模糊支持向量机组织成具有惟一根节点的有向图结构,得到多类分类器FDGSVM;提取待测语音信号的Mel倒谱系数并将其作为特征向量,再通过FDGSVM将特征向量映射到非线性划分的主观平均意见评分(MOS)区间,映射值即为输出的语音质量的客观评价结果.实验结果表明,所提算法获得的评测结果与主观MOS评价之间的相关度,在闭集测试时可达0.91,在开集测试时可达0.88.  相似文献   

2.
该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。为提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG-4面部动画标准参数化的3-D头部模型,实现面部动画的同步生成。主观MOS评测结果表明:本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.42和3.50。  相似文献   

3.
基于改进GA的WRBF神经网络设计与应用   总被引:1,自引:1,他引:1  
针对单独自动设计径向基函数(RBF)网络和小波网络过程中对样本要求过于严格,以及输出层线性求和运算可能造成样本类别交叠的问题,结合两种网络结构简单的优点,设计了一种新的四层前馈神经网络--小波径向基网络(Wavelet radial basis network,WRBF).该网络在结构上,第一隐层对输入样本进行小波映射,实现对输入空间的压缩;第二隐层对第一隐层输出进行第二次非线性映射;在网络的训练方法上,利用多阶染色体混合编码实现两隐层间的选择性连接,并对遗传算法(Genetic algorithm,GA)进行改进,利用改进的GA同时优化网络结构和参数.通过对多输入单输出系统和热能表系数模型进行实验,结果表明:改进的GA减小了早熟收敛的发生,所设计的网络具有较高的建模精度.  相似文献   

4.
语音识别的神经网络方法研究   总被引:1,自引:0,他引:1  
用前馈多层神经网络方法研究了计算机对于不同语音输入者的识别能力。输入层为语音的平均频率、均方频率、频率宽度、平均振幅、均方振幅、振幅宽度;输出层为识别输入者;隐含层的节点数为8,最后预测结果成功率为82.5%.这为研究人与机器的语音识别提供一种方法。  相似文献   

5.
基于小波网络的永磁无刷直流电机无位置传感器控制   总被引:1,自引:0,他引:1  
通过对永磁无刷直流电机的无位置传感器检测原理和小波网络特性的分析,提出了基于小波神经网络的永磁无刷直流电机无位置传感器控制新方法.该方法构建小波网络模型,采用梯度下降法对网络进行训练.网络训练分为离线训练和在线训练,由离线训练初步确定网络隐层节点的小波平移因子、尺度因子及网络输出层权值.以滤波和逻辑处理后的网络输出信号为教师对网络输出层连接权进行在线调整.从而由电机的相电流、端电压映射出电机的换相信号,取代了传统的位置传感器.最后仿真及实验结果表明,该方法能得到准确的永磁无刷直流电机的换相信号.  相似文献   

6.
LM算法在神经网络语音识别中的应用   总被引:1,自引:1,他引:0  
孙峰 《科学技术与工程》2011,11(9):2021-2024,2033
输入语音信号中声音的特征提取和分类识别可以通过多层前馈神经网络大量学习实现,但基于误差反向传播的前馈神经网络(BP神经网络)标准算法收敛速度慢,在训练中效率不高。采用一种快速稳定的Levenberg-Marquardt算法进行语音识别,通过对语音信号的预处理、特征提取和网络结果优化,建立了网络训练样本集,用MATLAB进行了仿真,仿真结果表明,该算法优于传统的BP算法,具有更好的收敛性。  相似文献   

7.
提出了一种高效心理声学模型语音质量评价(EPM-SQE)算法.该算法采用12阶美尔倒谱参数(MFCC)作为语音信号特征向量,其空间复杂度小于巴克谱.对MFCC进行相对谱(RASTA)滤波,可以突出快变信号对听觉感知的影响.将滤波后的参数映射为响度,由此模拟人的感知过程.计算原始语音和受损语音响度之问的感知扰动,并依次在频域和时域进行聚合,从而获得单一的扰动值,该值再经认知模型计算,可以得到最终的客观评分.实验表明,所提算法的平均运行时间比国际电信联盟提出的语音质量感知评价算法减少了41%,内存占用降低了51%,而仅比主观评价的相关度下降6.8%.  相似文献   

8.
一种基于神经网络的基波分量提取方法   总被引:1,自引:0,他引:1  
以方波模式运行的单相半桥逆变器为研究对象,提出了一种利用神经网络提取逆变器方波输出电压基波成份的新方法.给出了一种有效的网络结构、并基于仿真得到的大量样本数据训练一个前馈神经网络以映射逆变器方波输出电压对应的基波分量.  相似文献   

9.
一种基于因素贡献率的自适应前馈网络算法   总被引:1,自引:1,他引:1  
前馈网络具有很强的信息处理能力,但是实际应用中的样本量有限,训练出来的网络效果不太理想,本文提出一种自适应前馈网络算法,通过调节参数α向量,使网络结构按精确度和推广能力来综合考虑,若训练出来的网络满足先决条件,就认为网络规模是合适的,此算法不仅能删除隐层中的节点也能删掉输入层中若干总贡献率小的节点,从而避免了维数灾难,并给出一种调整剩余权重的算法,避免重新训练,文中讨论了网络结构的重要性,并用该方法进行仿真实验,结果证明了自适应前馈网络算法具有较强的建模能力。  相似文献   

10.
为了研究自组织特征映射神经网络在对于二维向量进行模式分类时,网络结构的最优化问题,深入研究了SOFM神经网络的结构和算法,说明了SOFM网络的建立方法。以二维向量的模式分类为例,利用所建立的SOFM网络模型对输入的二维向量模式进行分类,研究了输出层节点形状和拓扑结构对分类结果的影响,测试了在不同的训练步数条件下,SOFM模型的权值向量的调整过程和分类效果。仿真结果表明:当网络的输出节点以二维平面形式输出时,长和宽不相等的矩形图的分类性能明显优于正方形图的分类性能,并且在输出节点形式相同的情况下,六边型拓扑结构分类精度明显优于栅格型拓扑结构的SOFM神经网络。  相似文献   

11.
介绍建立在无限冲击响应分解/合成滤波器和快速搜索矢量量化算法基础上的16kb/s子带编码语音编译码方案。采用数字通信及数字信号处理技术,用单片数字信号处理器(TMS320C25)实现了基于该编译码技术的实时通信实验系统,给出了实验情况和评测结果。  相似文献   

12.
为了保证路面质量和行人与驾驶员的安全,提出了一种利用传感器时序多变量信号数据进行路面异常检测的算法.针对行驶过程中需要结合多种传感器信号在不同尺度对路面特征进行分析的问题,提出结合小波卷积网络和多通道网络技术,实现路面异常检测.首先,在多级小波变换间加入卷积神经元网络,从多个尺度分析单个传感器信号的局部连续性;然后,构建多通道神经网络,将多个传感器信号分别作为不同通道的输入,计算多个信号相结合的特征向量;最后,使用多层感知机根据多通道小波网络的输出实现路面异常检测.实验结果表明,该检测算法相对于传统的时间序列分类方法,同时考虑了多尺度分析、信号局部连续性和多变量信号的结合,在分析多变量时序信号数据时,具有更低的误检率和漏检率,更高的F1值.  相似文献   

13.
主要讨论了一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法,它是在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的,语音频谱动态特性是利用倒谱对时间的回归分析来表示的,这种度量方法中,使用倒谱系数,倒谱回归系数和能量回归系数3个参数的距离测量,在使用了谱包络信息的基础上,考虑了谱包络随时间的变化量及信号能量随时间的变化,比较了4种距离估算方法和主观音质评价(MO  相似文献   

14.
采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯混合模型相结合的语音带宽扩展算法.提取高、低频特征参数,并训练高斯混合模型,基于高斯混合模型参数训练偏移矢量的码本;在扩展阶段,利用偏移矢量的码本将低频偏移矢量映射为高频偏移矢量,再将高频偏移矢量与高斯混合模型估计部分相加作为估计的高频特征参数.对利用该方法进行带宽扩展后的语音质量进行主观/客观评测.实验结果表明,相比传统的GMM语音带宽方法,CM-GMM合成的高频语音更接近原始高频语音,明显消除了高频过平滑现象.   相似文献   

15.
用BP网求解模糊控制器输入量的隶属函数   总被引:1,自引:0,他引:1  
在模糊控制器设计中,需要对输入数据进行模糊化处理,用隶属函数描述;模糊变量隶属函数的选取对模糊推理有很大影响.利用BP网的分类性可以将采集到的清晰数据集广义地分成模糊类.选取具有一个隐层的PB网,输入层和隐层变换函数采用S函数,输出层用线性变换函数,在MATLAB环境下采用动量算法和自适应学习速率,调用trainbpx函数,对BP网进行训练,在训练时最后一层的输出越接近目标值越好.利用训练好的神经网可以对具体的输入数据求解对应于不同模糊区间的隶属值.用这种方法,速度快,误差小.  相似文献   

16.
基于双层前馈神经网络建立光伏电站输出功率与辐照等气象因素间的非机理模型。建立光伏电站输出功率与气象因素的神经网络模型;对功率模型的输入特征进行选择,分析不同气象因素的组合作为输入变量对模型准确度的影响,明确功率模型的输入变量;分析该模型网络的训练算法、隐含层神经元个数及训练次数对模型准确度的影响,据此确定功率模型的最优结构与参数;基于光伏电站的实际数据对功率模型进行验证。结果表明,基于双层前馈神经网络的光伏电站气象-功率模型具有较高的准确度。  相似文献   

17.
为了确定前向神经网络的网络结构,提出了一种基于采样数据的含单隐层神经元的模糊前向神经网络,反映了构造数据所蕴含的系统信息,其隐层神经元激励函数选择为三角型隶属函数和构造数据相应输出的乘积。该网络模型可以随采样数据的多少自主选择构造数据,自主设定隐层神经元,利用权值直接确定法得到网络最优权值。数值仿真实验表明,相比于现有文献的已有网络模型,模糊前向神经网络具有逼近精度高、网络结构可调、较好的预测性和实时性高的优点。  相似文献   

18.
东坡井田矿井构造的人工神经网络定量评价   总被引:2,自引:0,他引:2  
以东坡井田为例介绍了人工 神经网络方法在矿井构造定量评价中的应用。首先在分析了东坡井田矿井构造主要影响因素基础上,确定了12个指标作为指标;然后详细叙述了神经网络输入层、隐层及输出层神经元个数的确定以及利用有序的质量最优分割方法和插值法得到训练样本;最后经过学习对网络进行训练,利用此网络对划分出的东坡井田的评价单元进行评价取得了良好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号