期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

何书芹梁西银颜昌林郭贝刘昊《重庆大学学报(自然科学版)》2018,41(11):84-91

针对现有人体步态身份识别算法单一、准确率较低的问题,提出了一种基于多尺度熵和动态时间规整（DTW,dynamic time warping）的人体步态身份识别方法。采用自制的APP软件在较低采样率下采集人体步行加速度数据,实验中共采集50名志愿者的正常行走加速度数据,使用多尺度熵算法进行数据处理,得到在各个尺度下的熵值,最后采用DTW算法对多尺度熵值进行特征匹配,得到的相对错误率（EER,equal error rate）为13.7%,仿真结果表明基于多尺度熵和DTW算法相结合的方法较好提高了身份识别的准确率,为人体步态身份识别提供了一个新的思路。相似文献

2.

一种改进的DTW语音识别系统 总被引：1，自引：0，他引：1

苏昊王民李宝《中国西部科技》2011,10(1):38-39,94

动态时间规整(Dynamic Time Warping,DTW)是语音识别的一种简单有效的方法,该算法基于动态规划的思想,解决了发音长短不一的模板匹配问题,是语音识别中出现较早、较为经典的一种算法。这里改进了传统的DTW算法,将其应用到实时语音识别系统中,并在计算机上进行了仿真。实验结果表明,改进后的算法,能有效提高孤立词的识别性能。相似文献

3.

神经网络与DTW两种识别方法的比较

杨树林柯有安《北京理工大学学报》1993,13(4):519-523

在非特定人小字表场合下,比较了人工神经网络方法(ANN),动态规划方法(DTW)以及直接比较方法(DC).对汉语10个孤立数字测试结果表明:用多遍样本进行训练时,训练时间ANN至少是DTW的100倍,DTW是DC的5倍以上;识别速度ANN比DC快300倍,DC比DTW快5倍;存储量ANN比DTW和DC需要的都少;识别率ANN比DTW高2.3％,DTW比DC高6.7％;用单遍样本训练时,DTW比DC高3.6％,DC比ANN高8.1％.说明在小字表情况下ANN的总体性能优于DTW,DTW优于DC。相似文献

4.

一种新型的与文本相关的说话人识别方法研究

下载免费PDF全文

周雷龙艳花魏浩然《上海师范大学学报(自然科学版)》2017,46(2):224-230

在与文本相关的说话人识别研究中,既要包含说话人身份的识别,又要包含语音文本内容的识别.提出一种基于语音识别的与文本相关的说话人识别方法,从而建立说话人的声纹模型和语音文本模型,与传统的仅建立一种模型的方法相比,该方法能更精确地描述说话人身份信息和语音的文本信息,较好地解决了短时语音样本识别效果不佳的问题.测试实验表明,和传统与文本相关的说话人识别方法(如基于动态时间规整、高斯混合-通用背景模型)相比,由本方法建立的系统虚警概率降低了8.9%,识别性能得到了提高. 相似文献

5.

基于DTW的俄语短指令语音识别

王彤马延周易绵竹《山东大学学报(理学版)》2017,52(11):29-36

面向训练语料有限的语音识别任务,基于动态时间规整(dynamic time warping, DTW)算法对俄语语音进行识别。首先,以跨语言标注的语音语料为资源基础,研究融合音字转换和机器翻译的语音识别方法。其次,结合俄语语音特点,以元音为中心设置动态门限阈值,实现精确至音节的端点检测,识别速度提高了34.4%,准确率提高了14%。然后,综合时域、频域分析,提取反映语音静态特征和动态变化的参数模板。另外,引入全局限制和早弃策略改进DTW算法,避免病态匹配,缩小计算规模,使速度提高了19.7%,准确率提高了4.8%。在俄语短指令语音集上做五折交叉验证,识别准确率达到74.9%。相似文献

6.

Kinect骨骼信息下的动态手势识别研究

陈建军段富《科学技术与工程》2014,14(34)

针对复杂环境中存在的手势识别问题,提出一种利用Kinect传感器获取深度信息并进行动态手势识别的方法。该方法通过对Kinect传感器获取的深度信息进行分析,获取人体主要骨骼点的3D坐标,从中选取六个点作为手部运动的特征参照;为提高手势识别系统的识别速度,提出了一种基于查表的DTW算法对得到的特征数据进行模板训练并实现动态手势识别。实验结果表明:该方法具有较高的识别速度和识别率,对复杂背景及光照强度变化具有较强的鲁棒性。相似文献

7.

声控机器人的特定人孤立词汉语识别系统设计

何燕玲马建国《西南科技大学学报》2006,21(1):35-38

利用语音命令对机器人的行动控制,有很大的实用价值。介绍了采用动态时间弯折(DTW,Dynamic Time Warping)算法进行模式匹配的特定人孤立词汉语识别系统。DTW算法简单有效,尤其适合孤立词语识别系统。用凌阳单片机SPCE061A搭建的机器人平台对系统进行测试,结果表明,系统识别效果良好,控制者通过语音可以实时控制机器人行动。相似文献

8.

一种改进的基于小波去噪HMM非特定人语音识别算法 总被引：1，自引：0，他引：1

李锦何培宇《四川大学学报(自然科学版)》2007,44(1):69-72

在HMM算法的基础上引入了小波去噪理论，从而提高了原始语音的信噪比和最终识别率.由于分别对每段语音去噪并进行端点检测，大大降低了运算量，因而减少了训练时间，达到了较好的识别效果.通过与DTW算法的对比，证明了改进的HMM算法在非特定人语音识别中的良好效果. 相似文献

9.

基于多元时间序列融合的飞行动作识别方法

下载免费PDF全文

周超樊蓉张戈黄震宇《空军工程大学学报(自然科学版)》2017,18(4):34-39

针对飞行动作数据随机性强与长度不一致的问题,提出通过减小动态时间规整(DTW)算法的搜索空间,并定义不同特征参数贡献度的概念,实现对飞行数据的多元时间序列融合,从而完成对战术机动动作的识别。通过引入预分类和细分类结合的方式,对动作数据进行预处理,然后根据改进的动态时间规整(WDTW)算法对待测数据进行识别。仿真实验表明,相比传统DTW算法,WDTW算法通过降低算法复杂度,识别计算时间变化明显;对核密度与精准度系数的分析表明识别准确率亦有所提高。实验结果验证了所提方法的准确性。相似文献

10.

基于特征点统计模型的联机签名校验

陈彦丁晓青刘长松《清华大学学报(自然科学版)》2006,46(4):495-499

在联机签名校验中,动态时间规正(DTW)方法是一种常用的校验算法,在非线性时间对齐的基础上给出两个签名间的距离并进行判决,这样做经验的成份较多,缺乏统计基础。该文提出了签名的特征点统计模型,利用DTW算法在序列匹配的基础上从签名中提取到多个特征点,将每个特征点的变化情况描述为多维统计特征的概率分布,在所有特征点具有同样协方差分布的假定下得到具体的概率分布参数。按照此模型推导出了在最小风险准则下对签名进行真伪判决的判决准则。采用此方法对一个公共的签名样本库进行了真伪校验测试,得到了4.41%的等误率。相似文献

11.

基于背景重构的运动目标检测算法 总被引：2，自引：1，他引：1

董文明吴乐华姜德雷《重庆邮电大学学报(自然科学版)》2008,20(6):754-757

针对背景差分算法中的参考帧提取问题,引入动态时间弯折(DTW)算法,给出了一种新的基于块的背景重构方法。该算法根据相邻两帧图像所对应的背景区域灰度变化不大的特点,利用DTW算法从帧中提取出背景区域所对应的块,再确定出背景帧。仿真结果表明,即使是在图像存在几何畸变和部分像素点缺省的情况下该算法仍能准确地重构背景,实现对运动目标的提取。相似文献

12.

基于小波和动态时间弯曲的时间序列相似匹配

曲文龙张德政杨炳儒《北京科技大学学报》2006,28(4):396-402

提出了一种基于小波和动态时间弯曲(DTW)距离的时间序列索引和相似匹配方法. 该方法采用小波变换进行数据降维,利用R·-tree建立多维索引结构. 给出了查询序列的DTW距离边界和其在小波空间的查询超矩形的计算方法,从而将原始空间的基于DTW距离的相似匹配转换为小波空间基于欧氏距离的相似匹配. 证明了此匹配方法不会产生漏报,给出了基于DTW距离的范围查询算法和近邻查询算法. 实验结果表明该方法具有较高匹配精度和其较低的计算代价. 相似文献

13.

基于特征比较和模拟退火-遗传算法的普通话音素评分模型

王健关添叶大田《清华大学学报(自然科学版)》2012,(6):880-884

为了帮助发音困难者障碍者和外语学习者矫正普通话发音错误,提出基于Mel频率倒谱系数(Mel frequencycepstrum coefficient,MFCC)特征比较和模拟退火-遗传算法(simulated annealing genetic algorithm,SAGA)的普通话音素评分模型。该模型采用动态时间弯折(dynamic timewarping,DTW)算法对普通话音素进行相似度比对,并基于SAGA评分机制对发音进行自动评分。本文对比了不同优化算法(SAGA和局部优化算法)、不同DTW算法对语音评分的影响。结果发现:SAGA评分模型下的音素评分正确率大于94%,远远优于局部优化算法。此外,在SAGA评分模型下,搜索路径为平行四边形的改进DTW算法具有最优的评分结果。因此,基于MFCC和SAGA的评分模型适用于普通话音素评分。相似文献

14.

流媒体音乐质量客观评测方法设计

魏耀都杨越谢湘《北京理工大学学报》2010,30(10):1217-1220

针对音频感知质量评价模型(PEAQ)在流媒体音乐质量评测中存在的问题,提出一种针对流媒体音乐质量客观评测的框架——流媒体音频感知质量评价模型(PESAQ).用PESAQ设计对齐算法消除流媒体音乐中的抖动,并使用PEAQ评测编解码、噪声等造成的损伤,同时引入基于梅尔倒谱系数的动态时间规整最小距离对抖动造成的损伤进行评测,最后综合两种损伤的评测结果得到流媒体音乐的客观质量评分.主客观对比实验表明,PE-SAQ对流媒体音乐质量的评测结果比PEAQ更接近主观实验结果. 相似文献

15.

基于DTW的LPM在面部遮挡人脸识别中的应用

张晓伟《科学技术与工程》2014,14(5)

针对面部遮挡人脸识别问题中遮挡源变幻莫测、遮挡位置、大小及形状未知而导致从人脸图像中分割遮挡区域困难的问题,提出了基于动态时间规整(DTW)的局部分块匹配(LPM)算法。首先,将人脸图像划分成若干大小相等且互不重叠的局部小块;然后,借助于光栅扫描顺序将各个小块按照前额、眼睛、鼻子、嘴巴和下巴的顺序连接成一个单一序列;最后,计算查询人脸与注册人之间图像到类的距离,并利用动态时间规整的设计思想寻找查询序列与所有注册序列之间的最佳对齐方式。在两个公开人脸数据库FRGC2.0、AR及一个户外人脸数据库上的实验验证了所提算法的有效性及可靠性,实验结果表明,相比其它几种较为先进的人脸识别算法,所提算法取得了更高的识别率,此外,所提算法无需任何训练过程,计算成本低,更适合应用于现实面部遮挡人脸识别中。相似文献

16.

弹性动作关联序列的模式检索

Wang Li Xia Liangzheng Pan Hong 《东南大学学报(自然科学版)》2008,(Z2)

视频检索要求在数据库中能够找到与待检索视频序列相关的序列,该相关序列也可以是数据库中某个序列的部分序列,为此提出了一个动态编程方法.该方法综合了计算信息领域的编辑距离算法和信号处理领域的动态时间规整(DTW)算法,并克服了它们都不能直接用于动作检索的局限性,由于可以通过调节参数使所提方法转换为上述2种方法,所以可把它们看作是所提方法的特例.通过在不同数据库上的实验,以及和编辑距离算法和动态时间规整算法的比较,发现在相同的误检率条件下,所提算法的检测率要好于其他2种算法. 相似文献

17.

基于行人航位推算的后向地磁匹配算法

王安义欧雪《科学技术与工程》2021,21(5):1707-1712

针对行人航位推算(pedestrian dead reckoning,PDR)定位存在误差累积和智能手机内置传感器精度不高的问题,采用PDR结合地磁的方法进行室内定位研究,提出一种改进的基于PDR的后向地磁匹配算法.在构建地磁基准库阶段,使用克里金插值算法有效减少数据采集所耗费的大量时间并构建出双分辨率地磁基准库.在地磁匹配阶段,改进了基于动态时间规整(dynamic time warping,DTW)的后向地磁匹配算法,改进后的算法避免传统DTW地磁匹配需要全局搜索地磁序列的缺点,在保证定位精度的前提下,增强了定位实时性.实验结果表明,本文算法最大定位误差小于1.5m,可以满足普通室内定位需求. 相似文献

18.

采用DTW算法和语音增强的嵌入式声纹识别系统

周跃海童峰洪青阳《厦门大学学报(自然科学版)》2012,51(2):174-178

动态时间规整(dynamic time warping,DTW)是一种相对简单成熟的算法,广泛用于语音识别系统中.针对环境噪声对声纹识别系统性能的影响,用信噪比关联谱减及自适应门限端点检测进行抗噪声处理,在此基础上采用DTW算法设计了基于嵌入式ARM9平台的声纹识别实现方案,并给出了带噪环境下的声纹识别实验结果. 相似文献

19.

在线签名鉴别的改进DTW算法

单海涛毕胜王强《大连海事大学学报(自然科学版)》2007,33(1):123-126,130

论述一种改进的在线签名鉴别算法,在原有的应用DTW算法基础上,在所需鉴别签名的动态特征中加入角度特征,克服了规整中将两个签名中的同一笔画规整成不同的笔画的弊端,提高了鉴别的准确率.同时,提出的选取最优化样本的方法更好地增强了在线签名的实时性,并且通过反复试验得以验证. 相似文献

20.

复杂背景下基于肤色检测的动态手势分割与识别

唐文权徐武文聪郭兴《科学技术与工程》2019,19(33):330-335

在类肤色的复杂背景下,基于肤色检测的动态手势识别会因肤色干扰导致识别效率较低。提出了一种基于YCbCr颜色空间的改进三帧差分法的动态手势识别方法。首先利用改进的三帧差分法对动态手势进行分割,有效去除类肤色背景;然后根据人体肤色在YCbCr颜色空间中的聚类效果,采用基于椭圆模型的肤色检测方法有效去除非肤色背景,分割出手势区域。通过双特征提取,有效去除大范围的肤色背景,最终得到完整的手势;最后利用BP神经网络较强的自学习能力,对分割的动态手势进行检测识别。实验结果表明,此方法在应对环境变化时具有较好的实时性和抗干扰能力,拥有较高的识别率。相似文献