首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
为提高铁道车辆工程应用中自动监测与故障诊断的准确性,对5种常用的特征点检测方法进行了对比研究,采用 SIFT (Scale Invariant Feature Transform)特征点检测实现重叠图像的拼接算法。在较宽松的条件下准确地匹配两幅图像。实验证明,该算法能有效地拼接普通相机拍摄的照片,消除图像扭曲、交叠和旋转对图像拼接的影响,并获得高分辨率的场景照片。  相似文献   

2.
基于语音声学特征的情感信息识别   总被引:10,自引:0,他引:10  
为提高情感语音识别的正确率,研究了声学参数的统计特征和时序特征在区分情感中的作用,并提出了一种将两者相融合的情感识别方法。在提取出基本的韵律参数和频谱参数后,首先利用PNN(probab ilistic neura l netw ork)和HMM(h idden m arkov m ode l)分别对声学参数的统计特征和时序特征进行处理。计算它们各自属于每类情感的概率,获得采用加法规则和乘法规则融合统计特征和时序特征的识别结果。实验结果表明:各组特征在区分情感方面的侧重不尽相同,通过特征融合,平均识别正确率相较单独采用统计特征或时序特征均有提高,在最好情况下达到了92.9%。这说明了该方法的有效性。  相似文献   

3.
针对现有语音活动检测特征易受各种环境噪声影响而导致检测性能恶化的问题, 提出基于相位调制特征的语音活动检测算法。相位调制特征能充分表征语音动态特性, 与静态特征相比, 更能体现语音和噪声间的差异, 从而保证良好检测性能。与传统美尔频率倒谱系数特征的检测对比实验结果表明, 相位调制特征明显优于美尔频率倒谱系数。  相似文献   

4.
在特殊应用领域,注册者只能注册一张人脸信息,使得人脸注册信息极为有限,给人脸识别带来很大的限制。文章以参考集为基础,开展了基于特征关联性的人脸高层特征研究,通过对参考集中该人脸的所有图片特征均值和训练集、测试集中数据进行距离计算,将对应训练集、测试集中的各人脸的距离依次组合构成向量作为该脸的高层特征,该方法在很大程度上解决了注册信息缺失的问题;在Multi-PIE库和扩展YaleB库中进行了实验,并与基于稀疏表示的分类(sparse representation-based classifier,SRC)算法进行了对比。实验表明:该算法比余弦距离分类方法人脸识别的正确率提高5%~6%;与SRC算法相比,该算法更具有优越性。研究结果对单训练样本条件下的人脸识别研究有一定作用。  相似文献   

5.
基于帧间重叠谱减法的语音增强算法及实现   总被引:4,自引:0,他引:4       下载免费PDF全文
采用短时谱分析,合成技术,对含噪语音进行帧间重叠谱减法消除噪音,这种算法符合语音特性连续变化的特点。实验证明,该方法有效去除了噪声干扰,得到了增强语音,保证了话音的可懂度和自然度不受损失。  相似文献   

6.
探讨基于VoiceXML通过电话(固定或移动电话)的声音指令建立Internet的声音浏览器交互服务. 在Tellme Studio为开发平台下, 利用VoiceXML标准作为声音文件并与XML动态数据库技术相结合, 实现Web天气信息实时语音交互查询, 提出了一种基于VoiceXML标准的天气信息语音发布模式.  相似文献   

7.
针对传统端点检测算法因忽视语言特点导致的检测精度不足问题,结合元音中心论、响度说、合张运动说等俄语音节理论,提出一种面向俄语语音的音节端点检测算法.算法利用共振峰能量检测元音,并根据元音动态调整门限,基于短时过零率和能熵比提取和切分音节.算法在元音检测中查准率为84.9%,查全率为87%,音节切分的正确率为78.6%,端点检测精度为91.6%,较传统算法剔除了音节间的无话帧,提高了端点检测的精度.  相似文献   

8.
基于DSP实现语音端点检测   总被引:1,自引:0,他引:1  
介绍了一种以DSP芯片为核心的语音端点检测模块,用于有线/无线自动转接设备。该模块的语音端点检测算法应用短时能量、短时过零率和短时自相关语音特征参量进行联合检测,达到了比较满意的端点检测效果。该模块应用于系统中能够实现通话方语音对通话过程的自动控制。  相似文献   

9.
用小波变换法对语音基频进行检测。结果表明 ,小波变换法比传统方法更准确地提取基频 ,并具有相当的稳健性和适应性。对汉语而言 ,有利于语音四声的识别  相似文献   

10.
基于小波变换的语音基频检测   总被引:2,自引:0,他引:2  
  相似文献   

11.
基于小波变换的语音激活检测   总被引:4,自引:0,他引:4  
为了提高语音激活检测在多种噪声环境下的检测性能,基于语音与噪声相区别的主要特征,提出了一种基于小波变换的语音激活检测算法.算法将信号频带划分为多个子带,提出用归一化谱分布向量表征信号的谱分布特性,利用小波检测信号分形特征的能力,提出用信号的自相关指数来表征信号的自相关性,结合归一化谱分布向量的线性加权和自相关指数两个因素得出新的激活检测判决准则.实验仿真结果与ITU标准G.729和ETSI标准AMR2中的检测性能进行了分析比较.结果表明,该算法在多种噪声环境下都具有较高的准确率和稳定性.  相似文献   

12.
基于DWT变换的语音端点检测   总被引:1,自引:1,他引:1  
根据语音特性,提出一种基于离散子波变换(DWT)的语音端点检测方法.该方法利用(数字)语音信号的多尺度能量分布特性和不同分辨率下重构语音信号的相关特性来刻画(数字)语音信号,从而在噪声中检测出语音信号的端点.仿真试验结果表明:基于DWT变换的端点检测法与常用的端点检测方法相比,具有更好的抗噪性和识别稳定性.  相似文献   

13.
基于人工神经网络的多媒体语音特征挖掘   总被引:1,自引:0,他引:1  
提出了一种基于人工神经网络的聋儿语音训练识别的多媒体特征挖掘技术,构造了邻域三层神经元合作竞争的动态运行为神经元模型,实验选取了动态递减函数、动态最小覆盖矩阵和动态确定阈值形成的SOLA挖掘算法,以及聚类分布的网络图技术,解决了聋语音训练系统中基本语音识别的难题。  相似文献   

14.
利用语音在DCT域的稀疏性,提出了一种基于语音分为清音和浊音的特点,自适应分配观测点数的语音重构方法.首先根据清浊音在整个语音段占有的能量比分配观测点,然后判断每帧语音性质.如果是清音,则根据能零比的大小来分配该帧的观测点数;如果是浊音,则根据能量的大小来分配观测点数.实验表明:语音信号是稀疏的并且可压缩,在同种压缩比下,文中所采用的语音重构算法具有较好的信噪比、误差以及MOS分.  相似文献   

15.
余路  江小平  牟海军 《科技信息》2013,(6):172-172,173
本文提出一种基于重叠分块的背景建模方法,每个分块由其二维离散小波变换的低阶系数作为描述子表示。提出一种阶梯型模型参数更新方法,为每个分块建立一个高斯模型以适应训练视频中存在前景的情况。利用在光照变化的情况下RGB空间中两帧像素的RGB向量夹角几乎不变的特性,建立了余弦距离分类器以适应光照变化。在像素级别的前景分割判决中采取了类似于多数投票判决的策略,有效减少了最终判决的错误概率。实验结果证明,该方法与传统方法相比具有较高的准确性。  相似文献   

16.
基于局部扩充的重叠社团检测算法由单个节点或团出发,不断添加新的节点而获得最终的社团划分,但现有算法均为每次添加一个节点,没有充分考虑所添加节点的局部信息,从而影响了社团检测结果的准确性.为此,文中提出了一种基于单步添加团的重叠社团检测算法,该算法从一个团开始,通过不断添加此团邻居内适应度增值最大的团,使算法在局部扩充时不仅考虑了所添加节点与已有社团的连接紧密性,而且考虑了所添加节点内部的连接情况.在真实网络和计算机生成网络上的实验结果表明,与现有基于局部扩充的重叠社团检测算法相比,文中算法可以更准确地检测出复杂网络中的重叠社团.  相似文献   

17.
为解决图像低级特征不能够均匀进行显著目标检测的问题,将高层先验语义和低级特征进行结合,提出一种新颖的基于高层先验语义的显著目标检测算法模型。利用深度卷积神经网络对输入图像以及显式显著性先验信息分别进行语义分割提取,得到显式显著性检测图;通过将图像中隐含的先验显著性特征与显著性值进行映射得到训练模型计算隐式显著性图;将显式显著性检测图和隐式显著性检测图进行自适应融合,形成均匀覆盖显著目标像素的精确显著检测图。为验证算法模型的有效性,将算法在具有挑战性的ECSSD和DUT-OMRON图像数据集进行实验仿真,实验结果表明,该算法的显著目标检测效果较其他方法有较为显著的提升。  相似文献   

18.
提出一种改进的干扰检测算法,在自适应门限的基础上增加一个干扰门限,对调制重叠变换后的数据进行双门限干扰检测。研究结果表明:该算法可有效克服自适应门限算法和传统双门限算法对高信噪比敏感的缺陷,在保证低信噪比条件下较高的干扰检测概率的同时,有效降低高信噪比、无干扰下的干扰误检概率,以及高信噪比、小干扰的检测概率。本文所提检测算法在大信噪比范围均保持良好的干扰检测性能。  相似文献   

19.
在虚假信息识别任务中,面对图文结合的虚假内容,基于单模态的模型难以进行准确识别.社交媒体中的虚假信息为吸引关注和迅速传播的目的,会使用夸张的词汇煽动读者的情绪.如何将情感特征引入多模态虚假信息检测模型进行多特征融合,并准确地识别虚假信息是一个挑战.为此,本文提出了基于注意力机制多特征融合的虚假信息检测方法(att-MFNN).该模型中先将文本特征和情感特征基于注意力机制融合,再与视觉特征组成多模态特征送入虚假信息识别器和事件分类器中.通过引入事件分类器学习不同事件中的共同特征,提高新事件的识别性能.att-MFNN在微博和推特(Twitter)数据集的准确率达到了89.22%和87.51%,并且F1、准确率、召回率指标均优于现有的模型.  相似文献   

20.
语音情感识别在人机交互中有重要的作用。在语音情感识别领域中,通常使用迁移学习解决语音情感数据难获取的问题,但忽略了语音数据的时序信息和空间信息。考虑到AlexNet网络中的参数来自图像数据集,不能完全表现语音数据的空间信息,并且不包含时序信息,因此提出通过膨胀卷积网络提取语音频谱图的空间信息,添加双向长短期记忆神经网络提取时序信息,并进行时空特征融合;针对语音中含有大量与情感无关的特征,通过将对数梅尔频谱图的三个通道作为输入,减少情感无关因素的影响,并添加注意力机制,选取情感权重大的时域信号。用公开数据集实验证明了方法的有效性,在WAR和UAR上都有提升。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号