首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
音素是一个语言体系中最小的语音单位,音素识别在大词汇语音识别任务中不受词汇和语句的限制.因此,选择音素作为识别单元,建立基于CNN-BGRU的神经网络模型,实现音素语谱图的分类.首先,使用短时傅里叶变换生成音素语谱图作为模型的输入;其次建立CNN-BGRU模型,利用改进的VGGNet模型提取音素语谱图的特征,再使用双向门控循环单元(BGRU)实现音素语谱图的序列信息表示;最后,通过Softmax分类器实现音素语谱图的分类.实验使用TIMIT英语语音数据集进行音素语谱图识别,准确率达到98.6%,优于CNN(VGG16)、CNN-RNN、CNN-BRNN、CNN-BLSTM这4个模型.  相似文献   

2.
使用录音设备对1 605个常用汉字进行录音,得到920个孤立字发音、3 680个非特定人的语音样本库.采用语音语谱图作为汉语单字语音识别的特征,构建了6层卷积神经网络应用于模型库的语音识别.通过深度学习方法对语音样本进行了训练和识别.实验结果表明,所构造的20-40-3500结构的卷积神经网络模型对语音样本库具有最好的识别效果,对测试样本的识别率达到97.87%,对全部样本的识别率达到99.32%.  相似文献   

3.
为研究信号相关性在语音情感识别中的作用,提出了一种面向语音情感识别的语谱图特征提取算法.首先,对语谱图进行处理,得到归一化后的语谱图灰度图像;然后,计算不同尺度、不同方向的Gabor图谱,并采用局部二值模式提取Gabor图谱的纹理特征;最后,将不同尺度、不同方向Gabor图谱提取到的局部二值模式特征进行级联,作为一种新的语音情感特征进行情感识别.柏林库(EMO-DB)及FAU Ai Bo库上的实验结果表明:与已有的韵律、频域、音质特征相比,所提特征的识别率提升3%以上;与声学特征融合后,所提特征的识别率较早期声学特征至少提高5%.因此,利用这种新的语音情感特征可以有效识别不同种类的情感语音.  相似文献   

4.
针对佤语语谱图的识别无需考虑清、浊音的影响这一特征.利用傅里叶变换将佤语转换为对应的语谱图信息,将深度卷积神经网络的AlexNet模型用于佤语语谱图识别.实验表明,语谱图识别可以有效解决语音识别过程中清、浊音对实验识别结果的干扰,实验准确率达到96%.  相似文献   

5.
基于分数阶傅里叶变换步态特征提取   总被引:2,自引:1,他引:1  
针对短时傅里叶变换等时频分析方法不能提取由腿部和手臂运动产生的细致微多普勒特征这一问题,提出了采用分数阶傅里叶变换的雷达步态信号分析方法.在短时傅里叶分析的基础上,应用分数阶傅里叶变换对步态回波信号进行处理,由实测步态数据生成分数阶傅里叶变换谱图并进行了详细分析.结果表明,通过分数阶傅里叶变换可以从步态数据中提取出手臂、腿部摆动的细致微多普勒特征.  相似文献   

6.
针对运动模糊图像的模糊方向检测问题,分析了运动模糊图像的频谱特性,提出基于二次傅里叶频谱的运动模糊方向检测方法.首先,对模糊图像做2次傅里叶变换得到二次傅里叶频谱;其次,对频谱各像素按灰度值大小做排序,取排序第100的像素灰度为阈值使频谱转换为二值图像;最后,过二值图像中心作不同斜率的直线,通过计算所有亮点到直线的距离确定运动模糊方向.实验数据显示,该方法检测运动模糊方向的精度高,且具有较强的抗噪声能力.  相似文献   

7.
一种特定人声道频率响应的精确的提取方法   总被引:2,自引:2,他引:0  
提出了一种在浊音中切取相当基音长度的一段波形,用傅里叶变换求出谱线,多次填充构造精确声道频率响应函数的新方法.经过实验,证实此方法特别适合特定人的语音识别,也能较好合成出模仿特定人的语音.  相似文献   

8.
光谱分类是研究恒星光谱的重要内容之一,对其进行准确分类识别在天文研究领域有着重要意义.提出一种新的光谱特征提取方法,利用短时傅里叶变换将一维光谱变换为二维傅里叶谱图像,然后利用卷积神经网络对得到的二维傅里叶谱图像进行分类,由于二维谱图像具有新的特征分布,提高了分类精度;在此基础上,为降低短时傅里叶变换中的采样过程造成的信息损失,在进行短时傅里叶变换前先利用一维卷积对一维恒星光谱数据进行处理,以提高分类准确率,实验结果显示证明了新的方法的有效性.  相似文献   

9.
使用基于粒子群算法优化支持向量机识别算法实现对普米语语音的识别.首先通过傅立叶变换绘制出每条普米语语料的语谱图;再次,提取每张语谱图的图像特征构建特征向量;最后,运用支持向量机实现对普米语孤立词的分类.在运用支持向量机进行分类时,为了能够找到全局最优解,使用粒子群算法对支持向量机中的惩罚参数c和核函数参数g进行了优化,基于最优参数的分类准确率达到了89. 8%.  相似文献   

10.
为了准确区分各种肺音信号,获得更理想的肺音识别效果,提出了一种基于语谱图的改进型LBP肺音识别方法.首先通过短时傅里叶变换将肺音信号转化为灰度语谱图;其次利用改进后LBP算法计算语谱图的局部纹理关系,将局部二值模式特征进行级联构成特征向量;最后利用支持向量机对正常肺音和三类异常肺音信号进行识别分类.结果表明,该方法对不同肺音信号的识别率可达92.59%,为肺部疾病的医疗诊断提供了新的思路.  相似文献   

11.
复制-粘贴篡改是最简单和最常见的一种数字图像伪造方法,即把图像中的一部分区域进行复制并粘贴到同幅图像的其他区域,数字图像篡改认证具有重要的理论意义和应用价值.文章提出了一种新的采用分数阶傅里叶变换对数字图像复制-粘贴区域进行检测的算法.算法首先对待检测图像进行一级小波变换,降低图像维度.对变换后的低频子带分解成大小一样、互相重叠的子块.然后对子块进行分数阶傅里叶变换,将变换系数构成特征矢量.再对所有特征矢量进行字典排序.最后通过比较相邻两块特征矢量之差以定位复制-粘贴篡改区域.实验结果表明,提出的算法能有效地检测数字图像的复制-粘贴伪造区域.  相似文献   

12.
窗口傅里叶变换和S变换都是常用的时频分析技术.窗口傅里叶变换采用大小固定的时频分析窗口对信号在时域和频域进行处理.S变换采用受到信号瞬时频率控制的可变窗口对信号进行分析,它集合了窗口傅里叶变换和小波变换的优点.论文对比分析了基于"脊"处理思想的二维(2-D)窗口傅里叶和2-D S变换在基于结构光投影的光学三维面形测量中的应用.推导了他们用于条纹图相位场计算的表达式,并对比了他们的三维重建效果.模拟和实验都表明:基于"脊"处理的二维S变换方法比二维窗口傅里叶变换方法有更高的相位提取精度,即使分析严重噪声污染的条纹,采用二维S变换也能得到满意的三维重建效果.  相似文献   

13.
写出了文字图像的数学函数,并求出其付里叶变换,得其频谱,在频域中采样后绘出双元全息图.此法精度高,较一般离散付里叶变换法(D.F.T.)的计算量大为减少,用本方法对“E”字图像仅需30×30个样点,“中国”二字仅需60×60个样点即可提出清晰图像。  相似文献   

14.
利用二维傅里叶变换(FFT)消除刻槽,并通过同态滤波增强裂缝对比度;采用自适应方向的LoG算法在空域中增强裂缝;使用Otsu法,对全局图像进行二值化处理,并利用方格法提取裂缝片段;在此基础上,使用曲线累加变向法计算目标光滑程度,实现“沥青拉丝”的剔除.试验表明,本文方法具有良好的识别效果.  相似文献   

15.
 分数阶傅里叶变换是传统傅里叶变换的一种扩展形式,它能够在介于时域和频域之间的分数域内分析和处理信号。由于分数阶傅里叶变换的一些独特的性质,已经被广泛应用于解微分方程、量子力学、图像处理和信号处理当中。本文介绍分数阶傅里叶变换,综述其在滤波器、神经网络、图像处理和无线通信等领域的应用;结合本课题组近年来的工作成果,重点介绍了其在光通信领域中的典型应用;展望了分数阶傅里叶变换在光通信中的发展趋势。  相似文献   

16.
利用傅里叶红外光谱和特征基理论,对茶叶的产地进行研究.采集新茶叶样品的光谱数据,通过选择合适样品建立光谱特征基,将新采集茶叶的光谱数据在反映茶叶产地特性的光谱特征基上投影,依据茶叶产地的地域特征不同,在主成分分析思想的基础上提出了二次特征提取方法,并对比分析得出利用二次特征提取方法处理红外光谱图的可行性,而且可以有效地识别不同产地茶叶的特征.  相似文献   

17.
分数阶傅里叶变换的数值实现   总被引:2,自引:0,他引:2       下载免费PDF全文
信号及其傅里叶变换可以分别反映信号在时频两域内的信息。傅里叶变换是一种常用的数学工具,在数学、物理及工程技术领域都得到了十分广泛的应用。介绍了一种崭新的信号分析工具——分数阶傅里叶变换,并用经典的傅里叶变换的观点对分数阶傅里叶变换进行了解释。对于分数阶傅里叶变换的实现,因一般情况下分数阶傅里叶变换给不出解析表达式,故分数阶傅里叶变换的数值算法的研究是十分重要的。给出了分数阶傅里叶变换的较准确的数值计算方法。利用此方法对被线性调频函数污染混叠的高斯信号进行了滤波分离。  相似文献   

18.
首先,通过傅里叶变换获得含有疵点的织物频谱图,根据频谱图设计频域滤波器分离正常的纹理信息,保留疵点信息;然后,通过傅里叶逆变换进行灰度图重构,得到去除正常纹理的疵点图像;最后,经过高斯平滑后二值化分割出织物疵点.实验选取5种织物疵点进行验证,结果表明:采用频域滤波的织物疵点检测方法检测效果良好,且检测率达到90%以上.  相似文献   

19.
为了进一步提高加密效果和效率,本文提出一种基于小波分解和分数阶傅里叶变换的混沌图像加密方法。加密过程包括三个步骤:首先利用混沌序列对图像进行像素值扰乱;然后进行小波分解并提取出低频分量,对其进行分数阶傅里叶变换;最后进行混沌置乱得到最终加密图像。仿真结果表明该方法能够成功实现图像的加密和解密,具有很好的加密效果和安全性。  相似文献   

20.
基于分数阶傅里叶变换的宽带LFM信号波达方向估计新算法   总被引:11,自引:0,他引:11  
提出一种新的基于分数阶傅里叶变换和信号子空间分解的宽带线性调频(LFM)信号波达方向(DOA)估计算法.该方法利用LFM信号在分数阶傅里叶变换域的极高的聚集性,在分数阶傅里叶变换域分离信号,并构造分数阶傅里叶变换域的阵列信号相关矩阵.通过对相关矩阵进行特征值分解,估计信号子空间和噪声子空间,并利用MUSIC算法估计宽带LFM信号的波达方向.仿真验证了新方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号