期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《东北师大学报(自然科学版)》2017,(2)

以语音信号的语谱图作为处理对象,提出了基于语谱图二次傅里叶变换对特定人二字词汇识别的方法.首先对语谱图二次傅里叶变换频域图的图像意义以及相应的语音特性表征进行了详细剖析;然后对语谱图频域图像进行二进宽度行投影,将投影值作为语音识别特征值,以支持向量机为分类器,进行特定人二字词汇语音整体识别.采用1 000个语音样本进行了仿真实验.结果表明,该方法正确识别率可达到92.4%,为汉语词汇整体识别提供了新的思路. 相似文献

2.

基于CNN-BGRU的音素识别研究

《云南民族大学学报(自然科学版)》2020,(5)

音素是一个语言体系中最小的语音单位,音素识别在大词汇语音识别任务中不受词汇和语句的限制.因此,选择音素作为识别单元,建立基于CNN-BGRU的神经网络模型,实现音素语谱图的分类.首先,使用短时傅里叶变换生成音素语谱图作为模型的输入;其次建立CNN-BGRU模型,利用改进的VGGNet模型提取音素语谱图的特征,再使用双向门控循环单元(BGRU)实现音素语谱图的序列信息表示;最后,通过Softmax分类器实现音素语谱图的分类.实验使用TIMIT英语语音数据集进行音素语谱图识别,准确率达到98.6%,优于CNN(VGG16)、CNN-RNN、CNN-BRNN、CNN-BLSTM这4个模型. 相似文献

3.

基于时频域特征的场景音频研究

张勇张溯王旭东路阳王臣《吉林大学学报(信息科学版)》2018,36(3):300-305

随着人们对于场景音频研究的逐渐深入,现有的分析方式由于存在不能完整反映音频的声学特性等弊端,已经无法满足人们的需求。基于时频域特征的分析方式可以很好地解决这一问题,即通过提取场景音频的语谱图,使待分析信号中包含的声学事件得到完整保留,使其表现得更加直观。语谱图中包含着丰富的纹理信息,选取不同窗长,可分别得到场景音频的宽带语谱图和窄带语谱图。对比实验表明,窄带语谱图可以更好的反映出待分析信号中所包含声学事件的趋势、连续性及分布特征。因此对场景音频进行时频域特征分析更适合使用窄带语谱图。相似文献

4.

基于语谱图的改进型LBP肺音识别

曹春雷王双维吴颜生柴宗谦梁士利《东北师大学报(自然科学版)》2019,51(1)

为了准确区分各种肺音信号,获得更理想的肺音识别效果,提出了一种基于语谱图的改进型LBP肺音识别方法.首先通过短时傅里叶变换将肺音信号转化为灰度语谱图;其次利用改进后LBP算法计算语谱图的局部纹理关系,将局部二值模式特征进行级联构成特征向量;最后利用支持向量机对正常肺音和三类异常肺音信号进行识别分类.结果表明,该方法对不同肺音信号的识别率可达92.59%,为肺部疾病的医疗诊断提供了新的思路. 相似文献

5.

基于AlexNet模型的佤语语谱图识别

王翠王璐解雪琴和丽华潘文林《云南民族大学学报(自然科学版)》2019,(4):377-381

针对佤语语谱图的识别无需考虑清、浊音的影响这一特征.利用傅里叶变换将佤语转换为对应的语谱图信息,将深度卷积神经网络的AlexNet模型用于佤语语谱图识别.实验表明,语谱图识别可以有效解决语音识别过程中清、浊音对实验识别结果的干扰,实验准确率达到96%. 相似文献

6.

基于免疫遗传优化支持向量机的普米语孤立词语谱图分类

《云南民族大学学报(自然科学版)》2019,(1):100-104

基于免疫遗传优化支持向量机的普米语孤立词语谱图分类方法,首先利用短时傅里叶变(STFT)生成普米语孤立词语谱图;其次,提取普米语孤立词语谱图的二值特征;最后,利用免疫遗传优化支持向量机实现语谱图的分类.实验结果表明:普米语孤立词语谱图分类预测准确率为88%～91%.基于免疫遗传优化支持向量机的语谱图分类比基于语音信号分类效果更好. 相似文献

7.

基于特征语谱图和自适应聚类SOM的快速说话人识别

贾艳洁陈曦于洁琼王连明《科学技术与工程》2019,19(15):211-218

为获得说话人发音特征,基于仿生思想,提出一种基于语谱图统计的方法,通过对说话人短时语谱图的线性叠加获得可表征说话人稳定发音特征的特征语谱图。为解决资源受限的设备中说话人识别系统网络训练速度慢、识别效率低的问题,基于传统自组织映射(self-organizing feature map,SOM)神经网络提出了一种自适应聚类SOM (adaptive clustering-SOM,ACSOM)算法,随着待识别说话人数的增加,自动调节增加竞争层神经元个数,直至聚类数达到说话人个数。采用该AC-SOM模型对100人的自建特征语谱图样本库进行聚类识别,最大训练时间只需304 s,最大单张识别时间小于28 ms;在识别人数相同时,相对于所对比的其他识别方法,该方法大大提升了网络训练速度和识别速度,满足了边缘智能(edge intelligence)系统中对数据处理与执行的实时性的要求。相似文献

8.

基于多任务深度特征提取及MKPCA特征融合的语音情感识别

李宝芸张雪英李娟黄丽霞陈桂军孙颖《太原理工大学学报》2023,(5):782-788

【目的】针对传统声学特征所含情感信息不足的问题，提出一种基于多任务学习的深度特征提取模型优化声学特征，所提声学深度特征既能更好表征自身又拥有更多情感信息。【方法】基于声学特征与语谱图特征之间的互补性，首先通过卷积神经网络提取语谱图特征，然后使用多核主成分分析方法对这两个特征进行特征融合降维，所得融合特征可有效提升系统识别性能。【结果】在EMODB语音库与CASIA语音库上进行实验验证，当采用DNN分类器时，声学深度特征与语谱图特征的多核融合特征取得最高识别率为92.71%、88.25%,相比直接拼接特征，识别率分别提升2.43%、2.83%. 相似文献

9.

基于输出的语音质量客观评价方法研究 总被引：1，自引：0，他引：1

陈国胡修林杨灵朱耀庭《华中科技大学学报(自然科学版)》2001,29(5):86-88

在分析语谱图基础上提出了一种基于输出的语音质量客观评价方法－度量语亦图密度分布特征MDCSD（Measuring Distribution Characteristics of Spectrogram Density) 方法。该方法通过计算功率谱二维联合概率分布特征来描述不同质量语音信号的语谱图特征,并以此来对语音质量进行了客观评价,实验结果表明该方法是一种性能良好的基于输出的客观评价方法,其评价结果与主观评价的相关度达到0．8左右。相似文献

10.

基于PSO-SVM的普米语语谱图识别

杨花江涛董华珍陈绍雄傅美君潘文林《云南民族大学学报(自然科学版)》2018,(5)

使用基于粒子群算法优化支持向量机识别算法实现对普米语语音的识别.首先通过傅立叶变换绘制出每条普米语语料的语谱图;再次,提取每张语谱图的图像特征构建特征向量;最后,运用支持向量机实现对普米语孤立词的分类.在运用支持向量机进行分类时,为了能够找到全局最优解,使用粒子群算法对支持向量机中的惩罚参数c和核函数参数g进行了优化,基于最优参数的分类准确率达到了89. 8%. 相似文献

11.

面向语音情感识别的语谱图特征提取算法

《东南大学学报(自然科学版)》2015,(5)

为研究信号相关性在语音情感识别中的作用,提出了一种面向语音情感识别的语谱图特征提取算法.首先,对语谱图进行处理,得到归一化后的语谱图灰度图像;然后,计算不同尺度、不同方向的Gabor图谱,并采用局部二值模式提取Gabor图谱的纹理特征;最后,将不同尺度、不同方向Gabor图谱提取到的局部二值模式特征进行级联,作为一种新的语音情感特征进行情感识别.柏林库(EMO-DB)及FAU Ai Bo库上的实验结果表明:与已有的韵律、频域、音质特征相比,所提特征的识别率提升3%以上;与声学特征融合后,所提特征的识别率较早期声学特征至少提高5%.因此,利用这种新的语音情感特征可以有效识别不同种类的情感语音. 相似文献

12.

基于注意力机制语谱图特征提取的语音识别

姜囡庞永恒高爽《吉林大学学报(理学版)》2024,(2):320-330

针对连接时序分类模型需具有输出独立性的假设,对语言模型的依赖性强且训练周期长的问题,提出一种基于连接时序分类模型的语音识别方法.首先,基于传统声学模型的框架,利用先验知识训练基于注意力机制的语谱图特征提取网络,有效提高了语音特征的区分性和鲁棒性;其次,将语谱图特征提取网络拼接在连接时序分类模型的前端,并减少模型中循环神经网络层数进行重新训练.测试分析结果表明,该改进模型缩短了训练时间,有效提升了语音识别准确率. 相似文献

13.

Java和Matlab混合编程及其应用 总被引：1，自引：0，他引：1

王薇杨丽萍《长春大学学报》2012,(10):1186-1189

Java面向对象编程语言和Matlab具有各自的优缺点。将二者结合起来进行混合编程应用到情感语音特征值分析可以充分发挥其各自的优点,弥补单独编程的不足。本文介绍了通过Matlab调用Java及Java调用Matlab的技术,并简要介绍了在Java中调用Matlab实现情感语音语谱图的显示方法。相似文献

14.

图像及视频版权保护中的数字水印设计 总被引：1，自引：0，他引：1

高倩周丽娟《科学技术与工程》2007,7(11):2677-26782693

随着数字多媒体技术的不断成熟和发展,数字多媒体版权保护己成为当前研究的热点问题。对数字水印在多媒体版权保护中的应用问题进行了深入的研究和探讨。针对水印的一般性构架,提出了对数字图像和数字视频等多媒体产品进行保护的新方法和针对数字版权应用的实现方案。相似文献

15.

数字水印技术及典型的攻击分析

鄢喜爱常卫东田华《太原师范学院学报(自然科学版)》2005,4(3):36-39

数字水印技术是数字产品版权保护的关键技术，文章先对数字水印的系统模型、特性、算法等方面进行了探讨，然后分析了两种典型的数字水印攻击方式及相应对策，最后指出目前数字水印存在的缺陷并对其发展进行了展望。相似文献

16.

基于Gamma tone滤波和PCNN的说话人识别

金银燕《科学技术与工程》2010,10(30)

为了更好地提取说话人的特征,对语音进行滤波的预处理。Gamma tone滤波器可以很好模拟基底膜滤波器的形状,因此本文采用作为标准耳蜗听觉滤波器的Gamma tone滤波器对语谱图进行滤波,再通过脉冲耦合神经网络来提取说话人特征进行分析。仿真结果表明,由该方法得到的说话人的熵序列与自身熵序列的欧氏距离较未经过Gamma tone滤波的小,提高了识别率。相似文献

17.

HRV的频域时变分析方法及其应用

邱志诚曹洋《复旦学报(自然科学版)》1998,37(2):203-207

在ＨＲＶ频域分析中，比较研究了ＲＲ间期作为事件序列与化为时间序列分析所获得的结果。结果表明在平均心率较大和较小的时间片中，频谱将被改变。对后一种分析方法，我们借用“语谱图”的概念，将信号频谱随时间的变化直观地进行显示，提供了ＨＲＶ时和频域上较完整的变化信息。相似文献

18.

红外光谱法对粤北灵芝的快速鉴别

王少玲姚景彭翠红陈小康《韶关学院学报》2007,28(6):68-71

利用红外光谱对粤北灵芝进行了实验研究,分析比较了灵芝各部位及不同品种灵芝丙酮提取物的红外光谱图.结果表明：灵芝各部位的红外谱图基本相同,峰型相似;不同品种的灵芝子实体的红外谱图也基本相同;而不同品种灵芝的丙酮提取物的红外谱图与原样的谱图相比,存在不同的差异,可用于鉴别灵芝的品种. 相似文献

19.

提高重叠谱图分辨率的研究

方建兴吴茂成《苏州大学学报(医学版)》1998,14(3):44-47

本文介绍了微分消卷积分的基本原理,通过对模拟谱图与各种类型的实测谱图进行微分消卷积处理,说明该方法能使谱峰宽度减小,从而提高重叠谱图的分辨率,提高了重叠谱图的解析精度。相似文献

20.

一种基于改进多带谱减法的低信噪比语音识别方法

陈志博王思雨刘远泽王国栋耿卫东《南开大学学报(自然科学版)》2022,(6):58-61

提出了一种基于相位补偿改进的低信噪比多带谱减算法,构造了相位补偿函数对带噪语音相位谱进行补偿,使其更接近纯净语音相位,提升了多带谱减法在低信噪比下的性能.在Matlab仿真平台上就输出信噪比、PESQ和语谱图进行评估,所提算法均优于多带谱减算法,其中在-10 dB的极低信噪比下,该算法在PESQ上比原算法提高了26.4%. 相似文献