期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

赵海臣李良荣李丛飞《贵州大学学报(自然科学版)》2014,(2)

本文根据快速傅里叶变换(FFT)将时域信号变换到频域以及逆快速傅里叶变换(IFFT)将频域信号变换回时域的特点,对使用FFT将时域信号变换至频域,在频域上对信号进行相应处理,再使用IFFT变换回时域,获得所需处理效果的这一频域信号处理方式进行了深入研究。对使用FFT与IFFT组合完成诸如滤波,定量增益滤波,频段搬移,频谱复制等进行了针对性的分析以及测试,并提出了一种应用于音频处理领域的数字频域矩阵,可以大大方便音频信号在频域上的处理甚至能够直观地进行音频制作。所有的这些算法皆使用了音频进行验证,并且对每一次处理前后的音频的语谱图和频率谱进行了分析对比。结果显示,使用FFT与IFFT频域处理方式可以较好地完成多种信号处理功能,由于其原理简单,因此极大地方便了复杂信号的处理。相似文献

2.

基于多任务深度特征提取及MKPCA特征融合的语音情感识别

李宝芸张雪英李娟黄丽霞陈桂军孙颖《太原理工大学学报》2023,(5):782-788

【目的】针对传统声学特征所含情感信息不足的问题，提出一种基于多任务学习的深度特征提取模型优化声学特征，所提声学深度特征既能更好表征自身又拥有更多情感信息。【方法】基于声学特征与语谱图特征之间的互补性，首先通过卷积神经网络提取语谱图特征，然后使用多核主成分分析方法对这两个特征进行特征融合降维，所得融合特征可有效提升系统识别性能。【结果】在EMODB语音库与CASIA语音库上进行实验验证，当采用DNN分类器时，声学深度特征与语谱图特征的多核融合特征取得最高识别率为92.71%、88.25%,相比直接拼接特征，识别率分别提升2.43%、2.83%. 相似文献

3.

基于AlexNet模型的佤语语谱图识别

王翠王璐解雪琴和丽华潘文林《云南民族大学学报(自然科学版)》2019,(4):377-381

针对佤语语谱图的识别无需考虑清、浊音的影响这一特征.利用傅里叶变换将佤语转换为对应的语谱图信息,将深度卷积神经网络的AlexNet模型用于佤语语谱图识别.实验表明,语谱图识别可以有效解决语音识别过程中清、浊音对实验识别结果的干扰,实验准确率达到96%. 相似文献

4.

HRV的频域时变分析方法及其应用

邱志诚曹洋《复旦学报(自然科学版)》1998,37(2):203-207

在ＨＲＶ频域分析中，比较研究了ＲＲ间期作为事件序列与化为时间序列分析所获得的结果。结果表明在平均心率较大和较小的时间片中，频谱将被改变。对后一种分析方法，我们借用“语谱图”的概念，将信号频谱随时间的变化直观地进行显示，提供了ＨＲＶ时和频域上较完整的变化信息。相似文献

5.

基于输出的语音质量客观评价方法研究 总被引：1，自引：0，他引：1

陈国胡修林杨灵朱耀庭《华中科技大学学报(自然科学版)》2001,29(5):86-88

在分析语谱图基础上提出了一种基于输出的语音质量客观评价方法－度量语亦图密度分布特征MDCSD（Measuring Distribution Characteristics of Spectrogram Density) 方法。该方法通过计算功率谱二维联合概率分布特征来描述不同质量语音信号的语谱图特征,并以此来对语音质量进行了客观评价,实验结果表明该方法是一种性能良好的基于输出的客观评价方法,其评价结果与主观评价的相关度达到0．8左右。相似文献

6.

基于共振峰谐波能量的语音端点检测 总被引：3，自引：0，他引：3

刘红星戴蓓蒨陆伟《清华大学学报(自然科学版)》2008,48(Z1):754-759

共振峰和谐波成分是语音的一个典型特征.由于语音和环境的多交性,采用普通的方法提取这些特征存在很多困难.该文提出了一种在窄带语谱图上通过图像增强的方法,通过sobel算子计算窄带语谱图的方向场,通过Gabor滤波增强谐波区域,通过门限方法得到二值化圈,去除方向大于45°和依赖度低的点.得到连续的水平方向的带状分布,即谐波分布区域,求取谐波分布区域内的能量,以此作为门限判决的特征.实验结果表明,在不同信噪比、多种非平稳噪声环境下都能够达到较好的语音检出效果;同时这个特征不但能抑制高能量突发噪声,而且在非平稳噪声背景下的语音检测也表现出了优秀性能.其优点为,不需要噪声的先验知识,充分利用了语音在频率域和时间域的相关性,适应于各种非平稳复杂噪声. 相似文献

7.

面向语音情感识别的语谱图特征提取算法

《东南大学学报(自然科学版)》2015,(5)

为研究信号相关性在语音情感识别中的作用,提出了一种面向语音情感识别的语谱图特征提取算法.首先,对语谱图进行处理,得到归一化后的语谱图灰度图像;然后,计算不同尺度、不同方向的Gabor图谱,并采用局部二值模式提取Gabor图谱的纹理特征;最后,将不同尺度、不同方向Gabor图谱提取到的局部二值模式特征进行级联,作为一种新的语音情感特征进行情感识别.柏林库(EMO-DB)及FAU Ai Bo库上的实验结果表明:与已有的韵律、频域、音质特征相比,所提特征的识别率提升3%以上;与声学特征融合后,所提特征的识别率较早期声学特征至少提高5%.因此,利用这种新的语音情感特征可以有效识别不同种类的情感语音. 相似文献

8.

基于语谱图的改进型LBP肺音识别

曹春雷王双维吴颜生柴宗谦梁士利《东北师大学报(自然科学版)》2019,51(1)

为了准确区分各种肺音信号,获得更理想的肺音识别效果,提出了一种基于语谱图的改进型LBP肺音识别方法.首先通过短时傅里叶变换将肺音信号转化为灰度语谱图;其次利用改进后LBP算法计算语谱图的局部纹理关系,将局部二值模式特征进行级联构成特征向量;最后利用支持向量机对正常肺音和三类异常肺音信号进行识别分类.结果表明,该方法对不同肺音信号的识别率可达92.59%,为肺部疾病的医疗诊断提供了新的思路. 相似文献

9.

基于特征语谱图和自适应聚类SOM的快速说话人识别

贾艳洁陈曦于洁琼王连明《科学技术与工程》2019,19(15):211-218

为获得说话人发音特征,基于仿生思想,提出一种基于语谱图统计的方法,通过对说话人短时语谱图的线性叠加获得可表征说话人稳定发音特征的特征语谱图。为解决资源受限的设备中说话人识别系统网络训练速度慢、识别效率低的问题,基于传统自组织映射(self-organizing feature map,SOM)神经网络提出了一种自适应聚类SOM (adaptive clustering-SOM,ACSOM)算法,随着待识别说话人数的增加,自动调节增加竞争层神经元个数,直至聚类数达到说话人个数。采用该AC-SOM模型对100人的自建特征语谱图样本库进行聚类识别,最大训练时间只需304 s,最大单张识别时间小于28 ms;在识别人数相同时,相对于所对比的其他识别方法,该方法大大提升了网络训练速度和识别速度,满足了边缘智能(edge intelligence)系统中对数据处理与执行的实时性的要求。相似文献

10.

基于脉冲耦合神经网络的孤立词语音识别研究

刘琨金文标《重庆邮电大学学报(自然科学版)》2008,20(2):217-220

根据语音信号的“可视”特点,提出了一种基于简化脉冲耦合神经网络（PCNN）实现孤立词语音识别的方法。将语谱图输入到PCNN中得到相应的时间序列标识,作为语音信号的特征参数,然后通过模板匹配法和概率神经网络（PNN）相结合的方法实现语音分类识别。仿真结果表明,该方法能够达到较高的语音识别率。相似文献

11.

基于免疫遗传优化支持向量机的普米语孤立词语谱图分类

《云南民族大学学报(自然科学版)》2019,(1):100-104

基于免疫遗传优化支持向量机的普米语孤立词语谱图分类方法,首先利用短时傅里叶变(STFT)生成普米语孤立词语谱图;其次,提取普米语孤立词语谱图的二值特征;最后,利用免疫遗传优化支持向量机实现语谱图的分类.实验结果表明:普米语孤立词语谱图分类预测准确率为88%～91%.基于免疫遗传优化支持向量机的语谱图分类比基于语音信号分类效果更好. 相似文献

12.

语谱图在音频数字水印中的应用

杨春风张贵仓《科技信息》2009,(5):14-14,20

论文首先阐述了语谱图产生的机理，并且描述了语谱图的生成过程；接着提出了应用语谱图进行在音频文件中进行水印嵌入和提取的方法。相似文献

13.

语谱特征的身份认证向量识别方法

冯辉宗王芸芳《重庆大学学报(自然科学版)》2017,40(5):88-94

针对采用梅尔频率倒谱系数(mel-frequency cepstrum coefficient,MFCC)作为身份认证向量(identity vector,i-vector)进行说话人识别存在语音信息不全的问题,提出一种基于语谱特征的身份认证向量识别说话人的方法。语音信号经过预加重、分帧加窗预处理之后,通过短时傅立叶变换转换成语谱图,语谱图被提交到高斯通用背景模型,在高维均值超向量空间中选择合适的低维线性子空间流型结构以构造符合正态分布的向量作为身份认证向量。这些获取的身份认证向量经过线性判别性分析实现降维并存储。最后采用对数似然比(log-likelihood ratio,LLR)方法对训练和测试阶段的i-vector进行评分,完成说话人识别。以TIMIT数据库为标准的数值实验结果表明,相比采用MFCC作为特征的识别方法,研究的等错误率(equal error rate,EER)更低。相似文献

14.

基于双重数据增强策略的音频分类方法

下载免费PDF全文

周迅张晓龙《武汉科技大学学报》2020,(2):155-160

卷积神经网络模型作为音频特征提取器具有较好的应用效果,但该类模型的训练过程对数据量要求比较高。针对这一问题,本文提出一种基于双重数据增强策略的音频分类方法。首先采用传统音频数据增强方法(旋转、调音、变调、加噪),并将增强后的数据转化为语谱图,再采用随机均值替换法进行谱图增强。在此基础上训练Inception_Resnet_V2神经网络模型作为音频特征提取器,最后训练随机森林模型作为分类器完成音频分类任务。实验结果表明,与已有方法相比,采用双重数据增强策略可明显提升音频分类精度,并且训练出的特征提取模型具有较强的泛化能力。相似文献

15.

叙事语篇主题发展的时间认知建构

贺学勤《湖州师专学报》2010,(5):103-107

叙事语篇的主题与事件时间的关系是语篇认知研究中尚未深入探讨的课题。叙事语篇的发展构建于事件认知表征的基础之上,并且由表征事件与非事件的情状句共同达成语篇意义。在此建构过程中,事件情状句与非事件情状句以三种基本原则方式运作：完成性事件句推动语篇事件发展;非完成性事件句构成语篇事件场景或同时由完成性事件句启动成一连续整体事件中的小事件;完成性与非完成性事件句为语篇导向的非事件句和语篇意义的合理构建作支撑,以构建完整连贯的叙事语篇,实现语篇主题意义。相似文献

16.

旋转机械常见故障的振动三维谱特征及其识别 总被引：18，自引：0，他引：18

褚福磊李贵三 张正松《清华大学学报(自然科学版)》1996,(7)

变速过程中振动特征的提取及其识别对于旋转机械故障诊断是极其重要的，本文通过对发电设备旋转机械中常见的不对中、轴裂纹、动静件碰摩、基础部件松动故障的运动微分方程及三维谱图的分析，讨论了变速过程中系统振动所包含的故障信息。分析表明这几类带有故障的转子系统都是非线性振动系统，振动三维谱图中含有丰富的高次谐波分量，可以用对三维谱图进行扫描的方法来发现故障信息。三维谱图可以丰富旋转机械故障诊断系统知识库中的振动特征信息，对于更准确地诊断发电设备中的故障具有重要的意义相似文献

17.

谱图叠加法用于色谱微弱信号的检测

刘二东李志伟杨更亮王德先《河北大学学报(自然科学版)》2003,23(4):392-394

基于谱图叠加和小波分析技术,提出了一种新的信号处理方法--谱图叠加法.该法可以有效地提高色谱信噪比,使只能定性分析的信号达到定量分析的目的.应用此法处理对氨基苯甲酸毛细管电泳信号,信噪比从3提升至11,其结果令人满意. 相似文献

18.

2D-Haar声学特征超向量快速生成方法

谢尔曼罗森林潘丽敏《北京理工大学学报》2016,36(3):295-301

针对大数据量音频的高速处理,提出一种快速的声学特征超向量生成方法,有效提高音频识别系统的识别速度和精度.所提方法首先将多个连续音频帧的常用声学特征构成声学特征图,进而使用低复杂度的运算方法在其中快速提取维数达数十万的Haar-like声学特征;然后使用AdaBoost.MH算法,筛选出具有较高代表性的Haar-like声学特征模式组合,用以构成声学特征超向量;进而提出Random AdaBoost特征筛选方法,进一步提高特征筛选速度.实验结果表明,在音频事件识别、说话人识别、说话人性别识别3种场合下,使用Haar-like声学特征可以使SVM、C5.0、AdaBoost等识别算法获得比MFCC、PLP、LPCC等常用声学特征更高的识别准确率,同时可以获得7~20倍的训练速度提升和5~10倍的识别速度提升. 相似文献

19.

一种基于注意力机制的语音情感识别算法研究

甘宏《江西科学》2022,(4):758-761

随着语音识别和自然语言处理技术的成熟,智能语音技术逐步落地到各行各业,但目前智能语音产品缺乏情感的交互,未实现真正的智能。为了提升智能语音产品的拟人性,学术界对语音情感识别的研究热度越来越高,但是多局限在使用传统特征工程以及通用深度学习模型上。在应用深度学习模型的基础上引入注意力机制对语音情感识别展开研究,选用语谱图作为输入特征,并对CNN输出的特征进行通道维度的注意力关注,分析注意力计算过程中不同池化方式对识别结果的影响,并引入残差,提升模型表现力,最终UA实现了2.83%的提升。相似文献

20.

影响语篇记忆诸因素研究之评述

刘桂玲《长春师范学院学报》2005,24(5):104-107

从记忆中提取语篇信息的过程是一个系统且规律的过程.在回忆过程中,有些事件回顾起来更完整,而在回顾过程中有些本不存在的事件也添加进来了,回顾事件的时候人们是在遵循一定的顺序,所以说形成语篇的记忆表征的过程是非常有条理的. 相似文献