期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《华中科技大学学报(自然科学版)》2016,(12):127-132

为了满足移动语音通信中对语音内容保持操作的鲁棒性和区分性,并实现高效认证等要求,提出一种基于线性预测最小均方差(LP-MMSE)的高效语音感知哈希认证算法.该算法首先对待认证语音进行预处理、分帧和加窗后的语音信号进行线性预测分析(LPC)得到其最小均方差(MMSE)系数矩阵;然后对分帧后的语音利用谱熵法计算得到每帧的谱熵值参数矩阵;最后结合上述两个矩阵,生成最终的二进制感知哈希序列.仿真结果表明,该算法的感知哈希摘要性优于现有的其它方法并对内容保持操作具有较好的鲁棒性和区分性,认证效率高,能够满足语音通信实时认证的要求. 相似文献

2.

基于伪谐波模型的强鲁棒语音认证算法

张秋余张涛吴东方葛子贤《华中科技大学学报(自然科学版)》2018,(3):58-64

为了使语音认证算法在真实噪声环境下具有更强的鲁棒性,提出一种基于伪谐波模型的强鲁棒语音感知哈希认证算法.该算法首先对待认证语音进行预处理后分帧、加窗;然后通过输入一定的参考频率对每帧信号构造伪谐波模型,使每个频率对应一个单一成分的模型分析信号,并利用模型分析信号的突出幅度信息作为语音信号的感知特征值;最后对感知特征值进行哈希构造,生成二进制感知哈希序列来实现语音认证.实验结果表明:该算法对较强的真实环境噪声和一些常规的内容保持操作具有非常好的鲁棒性,同时区分性和认证效率能够满足语音通信实时性的要求. 相似文献

3.

基于卷积神经网络的鲁棒性说话人识别方法

曾春艳马超峰王志锋孔祥斌《华中科技大学学报(自然科学版)》2020,48(6):39-44

为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒谱系数(MFCC)特征进行自适应操作得到的,这一操作增加了帧与帧之间的关联性,使特征携带更丰富的说话人身份信息.同时采用卷积神经网络进一步对帧层面的信息进行对准,并从数据中学习到更有利于说话人识别的特征表示,从而提升说话人识别的鲁棒性.实验结果表明在Libri语音数据集上,所提出方法的鲁棒性优于GMM-UBM和GSV-SVM算法. 相似文献

4.

说话人识别中的Mel特征频率倒谱系数

曹辉徐晨赵晓吴胜举《西北大学学报(自然科学版)》2013,(2):203-208

目的研究语音特征梅尔频率倒谱系数(MFCC)的选取对说话人识别系统性能的影响。方法采用基于平均影响值(MIV)的支持向量机(SVM)方法研究了说话人识别中的梅尔频率倒谱系数各维倒谱分量对于识别分类的贡献度。结果选择具有代表性的特征向量进行说话人分类识别,能得到维数更低、识别率更高的特征参数。结论通过MIV值可判断各维特征参数分量的重要性,选取权重值高的MFCC特征参数来提高系统识别率和缩短系统运行时间。相似文献

5.

基于基频的梅尔倒谱系数在车辆识别中的应用

李成娟易强李宝清王国辉《重庆大学学报(自然科学版)》2021,44(11):17-23

用传统的梅尔倒谱系数作为特征进行车辆识别时,识别效果易受噪声干扰.为增强特征鲁棒性,提出一种加权的基频自适应梅尔倒谱系数特征提取算法.首先用能熵比法对车辆声音信号进行端点检测;然后提取车辆信号的基频,自适应构建三角滤波器组,提高滤波器对基频的感知敏感度;最后对基频自适应梅尔倒谱系数进行F比加权.实验结果表明,与传统梅尔倒谱系数相比,在识别车辆时,加权的基频自适应梅尔倒谱系数识别准确率提高7.10％,虚警率降低3.93％,漏警率降低7.10％. 相似文献

6.

一种用于遥感影像完整性认证的感知哈希算法

丁凯孟朱长青《东南大学学报(自然科学版)》2014,(4):723-727

为了实现遥感影像的完整性认证,提出了一种基于边缘特征的遥感影像感知哈希算法.首先,对影像进行格网划分,并对格网单元进行自适应的预处理.其次,采用Canny算子提取格网单元的边缘特征,进一步生成边缘特征矩阵.然后,对边缘特征矩阵进行奇异值分解,选择较大的奇异值作为格网单元的特征,并采用Hash函数进行归一化.最后,串联所有格网单元的归一化特征,得到影像的感知哈希散列.在影像接收端,计算待认证影像的感知哈希散列,并与收到的感知哈希散列进行匹配,实现遥感影像的完整性认证.实验结果表明,该算法能够有效检测遥感影像的局部细节篡改,对于保持影像内容不变的操作具备较好的鲁棒性,且运行效率较高,为遥感影像的内容完整性认证提供了一种高效途径. 相似文献

7.

基于用小波变换改进MFCC的语句识别方法

《科技信息》2008,(14)

在语音识别中最常提取的特征参数是Mel频率倒谱系数(MFCC)。但Mel频率倒谱系数不能很好的反映语音信号的动态特性。针对这种缺点,对常规的MFCC进行改进,采用小波变换替代MFCC提取过程中FFT变换,得到改进后的MFCC。采用这种方法后,识别率有了很大的提高。相似文献

8.

基于EEMD的异常声音多类识别算法

韦娟岳凤丽仇鹏宁方立《华中科技大学学报(自然科学版)》2018,(7)

为了提高异常声音信号的识别率,提出一种将总体平均经验模态分解和梅尔频率倒谱系数、短时能量及能量比相结合的特征提取改进算法,并对决策导向无环图支持向量机多类识别算法进行改进.首先对声音信号进行分帧,然后对每帧信号进行总体平均经验模态分解得到固有模态函数,最后对每层固有模态函数提取梅尔频率倒谱系数、短时能量和能量比特征.根据提取的特征,采用改进的决策导向无环图支持向量机算法对五种异常声音信号进行识别.仿真结果表明:改进的特征提取算法和决策导向无环图支持向量机多类识别算法相比改进前识的别率分别提高了2%和2.5%. 相似文献

9.

一种基于支持向量机的数字音频认证方法

林晓丹《华侨大学学报(自然科学版)》2011,32(2):153-155

提出一种基于数字水印技术的音频内容认证方法.选取稳定的梅尔倒谱特征构造特征向量,利用支持向量机自适应地选取合适的帧进行水印的嵌入和提取.结果表明,算法在保证嵌入水印的不可感知性的同时,能够有效地区分恶意的内容篡改和非恶意的常规信号处理操作,准确地定位篡改发生的位置. 相似文献

10.

基于能零比的多格式音频感知哈希认证算法

《华中科技大学学报(自然科学版)》2017,(9):33-38

针对现有的音频认证算法音频格式单一、算法不通用、认证效率低的问题,提出一种基于能零比的多格式音频感知哈希认证算法.该算法首先对待认证音频进行预处理、分帧和加窗,并计算每帧信号的短时能量和短时过零率,获得每帧信号的短时能量和短时过零率的比值;然后将获得的短时能量和短时过零率的比值作为音频信号的感知特征值;最后对感知特征值进行哈希构造,生成感知哈希序列.为提高算法的安全性,算法采用与哈希序列等长的密钥对哈希序列进行置乱.仿真结果表明:该算法对原始域和压缩域五种不同格式的音频内容都具有较好的鲁棒性和区分性,认证效率高. 相似文献

11.

基于特征融合矩阵语音音色的厚薄度客观评价

涂中文张勤靳聪赵薇《北京理工大学学报》2018,38(5):531-536

提出一种基于特征融合矩阵的语音音色的厚薄度客观评价方法.提取最符合人耳听觉特性的梅尔频率倒谱系数（MFCC）和线性预测系数（LPC）作为语音特征参数,同时提取了3种非语音参数特征,包括共鸣因子指数、身高质量指数和肺活量体重指数,将这些特征进行融合即可形成特征融合矩阵,采用softmax分类器对语音音色中的厚薄度进行分级.实验结果表明,该方法可以获得较高的分级准确率. 相似文献

12.

基于自适应PCNN与PCA的遥感影像感知哈希认证算法

丁凯孟朱长青罗文刘岳明《南京师大学报(自然科学版)》2019,(2)

针对现有遥感影像感知哈希认证算法存在的鲁棒性不足的问题,本文利用PCNN在边缘检测过程中能够抑制噪声的特点,提出一种基于自适应PCNN与PCA的遥感影像感知哈希认证算法.首先,对遥感影像进行四边形隐形格网划分之后,根据格网单元的信息熵自适应地决定PCNN的时间衰减参数.然后,通过PCNN提取格网单元的边缘特征,进而构造格网单元的特征矩阵.接下来,对特征矩阵进行基于PCA和信息熵的自适应摘要化,得到的序列进行加密处理后就是该格网单元的感知哈希序列.实验表明,该算法在保持篡改敏感性的同时,对无损压缩和LSB水印嵌入具有近乎100%的鲁棒性,对有损压缩的鲁棒性在95%以上,相比于现有算法有了较大提高. 相似文献

13.

数据挖掘技术在语音识别中的应用

下载免费PDF全文

许元洪郭琼《上海应用技术学院学报：自然科学版》2019,19(1):84-87

通过数据挖掘技术实现对语音来源的识别,从而完成对说话人身份的认证以及操作权限的分配,具有非常重要的理论和实际意义。主要针对相同和不同语音内容两个类别的说话人语音识别进行了研究。通过在说话人识别领域广泛应用的梅尔频率倒谱系数进行语音的特征提取,并结合动态时间规整算法进行模式匹配分类。特别地,在不同的语音内容识别探究中,在采用动态时间规整算法前,结合了K-means++算法以及主成分分析算法来对梅尔频率倒谱系数矩阵进行降维和聚类,以保证待匹配模板的维度相近或相同。结果表明,在相同语音内容的识别过程中,选择合适的阈值可以获得较好的识别效果。相似文献

14.

一种精确篡改定位的数字语音取证算法

《信阳师范学院学报(自然科学版)》2016,(2):289-293

提出了一种精确篡改定位的数字语音取证算法.语音信号分帧后,对各帧信号进行置乱.水印由帧号和信号系数自相关生成,并嵌入到置乱后的信号中.实验分析结果表明,本文算法具有较好的不可听性和对恶意攻击进行精确篡改定位的能力,同时,提高了水印系统的安全性. 相似文献

15.

基于动态时间规整算法的语音识别技术研究

《科技资讯》2017,(26)

语音控制作为一种新型的人机交互手段,给用户带来更多的操作体验,在很多特定场景中具有必要性。本文将梅尔倒谱系数(MFCC)作为语音特征参数,采用动态时间规整算法(DTW)进行模式识别和分类,实现了小样本孤立词汇的实时识别,具有高识别率。在基本算法的基础上进行了边界条件改进,克服了端点检测缺陷。在语音特征提取上,分析比较了线性预测系数(LPC)和梅尔倒谱系数(MFCC)作为特征参数的优缺点,最后选定基于人耳听觉特性的MFCC作为语音特征参数。语音信号采用NI公司USB-6218采集卡将数据直接传输至MATLAB开发平台,在MATLAB集成环境下实现了语音识别程序。实验结果表明,系统可以实现6个特定的孤立词识别,满足实时性和准确性要求。相似文献

16.

基于人类视觉模型和Contourlet变换的图像感知哈希算法

《阜阳师范学院学报(自然科学版)》2016,(4)

图像感知哈希(Perceptual Hashing)技术在图像的认证、识别和检索中得到广泛应用。融合人眼视觉系统(HVS)、Contourlet变换及奇异值分解(SVD)提出了一种新颖的图像感知哈希算法。该算法首先对图像进行Contourlet变换,计算变换后系数的视觉掩蔽特征值(掩蔽矩阵);然后对掩蔽矩阵分块后作奇异值分解,取每块最大奇异值作为图像的特征值,经过量化编码、压缩,生成最终哈希。该算法使用MATLAB作为实验平台,实验结果证明算法对大部分的感知保持操作具有较好的鲁棒性,不同图像之间也有较好的唯一性,同时对哈希进行加密处理,使得算法具有良好的安全性。相似文献

17.

基于改进MFCC的说话人特征参数提取算法

高铭孙仁诚《青岛大学学报(自然科学版)》2019,(1)

在说话人识别系统中,传统梅尔倒频谱系数(MFCC)所提取特征不能够很好的反映说话人动态特征,尤其在噪声环境中,识别率较低,鲁棒性不足。针对以上问题,提出一种基于改进梅尔倒频谱系数(MFCC)的方法,通过多窗谱估计和一阶、二阶差分的方法提升识别性能。实验结果证明,在纯净语音和添加信噪的情况下,改进后方法的识别准确率都有所提升。当训练集为纯净语音,只为测试集添加噪声时,实验结果依然有较高的准确率。相似文献

18.

基于服务机器人听觉的个体膳食构成自主感知算法

苏志东杨观赐李杨王怀豹《贵州大学学报(自然科学版)》2019,36(4)

针对现有服务机器人无法自主感知用户膳食构成的问题,提出了基于服务机器人听觉的个体膳食构成自主感知算法(AIDCPA)。首先,利用了基于梅尔频率倒谱系数和矢量量化算法的声纹识别方法识别出了说话人身份,并运用中文分词、词性标注和依存句法分析工具获取语音识别所得文本数据的语言特征;然后,给出了基于一阶谓词逻辑理论的推理定义和描述,提出了饮食组成获取的推理算法,进而形成了基于服务机器人听觉的个体膳食构成自主感知算法。为了评估AIDCPA算法性能,在服务机器人平台中实现了AIDCPA算法,并构建了训练和测试数据集。测试结果表明:系统感知饮食组成的F1值、精确度与召回率的均值分别为0.9491,0.9679和0.9407,有较强的感知鲁棒性。相似文献

19.

用于孤立数字语音识别的一种组合降维方法

《西安交通大学学报》2016,(6)

针对孤立数字语音识别的噪声鲁棒性问题,提出了一个组合降维方法。该方法由梅尔频率倒谱系数(MFCC)特征提取、线性降维、受限玻尔兹曼机(RBM)、Softmax分类器4个功能模块依次组成;基于主成分分析(PCA)基本原理对MFCC特征向量实现了降维并且统一维度的目的;通过RBM对降维后的特征向量进行学习,改善了后端Softmax分类器的分类性能,RBM的预训练由对比散度算法完成,微调过程使用共轭梯度算法。采用TI-46孤立数字语音库和NOISEX-92典型噪声数据库对方法进行了测试,实验结果表明,该方法可以获得96.09%的正确识别率,相对于常规神经网络识别方法,噪声鲁棒性得到了提高。相似文献

20.

用于抗噪声语音识别的谐振强度特征

许超曹志刚《清华大学学报(自然科学版)》2004,44(1):22-24

基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。相似文献