排序方式: 共有27条查询结果,搜索用时 15 毫秒
1.
基于并行基因算法的语音识别方法 总被引:1,自引:0,他引:1
提出一种基于并行基因算法的孤立字识别时间规正算法,该算法是在[3]的基础上提出,可解决动态时间规划(DTW)难以解决的一些问题:①使距离归一化因子M与实际路径相关;②以自然方式提供多条最佳规划路径;③语音端点检测正确性对识别率的影响得到一定程度的改善。建立了试验数据库,根据试验数据建立了模板距离遵循正态分布的算法性能分析模型。比较了并行基因算法,串行基因算法[3]和动态时间规划算法的性能。试验结果表明:基因算法比动态时间规划能得到更高的识别率,在单CPU情形下,虽然并行基因算法的性能比串行基因算法略微提高,但至少可节约三分之一的CPU时间 相似文献
2.
对于英语等"重音节拍语言",词重音是一个非常重要的韵律学特征、提出巴克谱子带能量(BSSE),巴克谱子带倒谱(BSSC)和巴克倒谱(BSCC)等三种使用子带方法,模拟人类听觉系统进行英语词重音检测的新特征.首先研究了在英语词重音检测中不同频带的贡献度,然后测试了在连续语音条件下使用这些特征的系统性能.试验结果表明,高频带对重音识别的贡献度比其它频带大,新特征的识别效果也比传统特征好. 相似文献
3.
针对贝叶斯信息准则(BIC)算法在说话人改变检测中计算量大、检测精度低的问题,文中提出了一种改进的BIC说话人改变检测算法.该算法通过限制分析窗内第一个数据窗的最大长度来降低计算量,并通过增加分析窗内第二个数据窗的有效长度(提高可测度)来提高检测精度;同时,该算法只在新增区间内寻找潜在说话人改变点,从而解决了长时间无说话人改变时计算量不断增大的问题.实验结果表明,该算法和传统的BIC算法相比,偏移误差范围由0.10~0.80降低到0.03~0.20;当分析窗长为40s时,计算时间节省了约75%. 相似文献
4.
针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特征提取上的优势,提出了基于正面唇重构与三维耦合卷积神经网络的多视角音唇一致性判别方法。该方法先通过在生成器中引入自映射损失来提高正面重建效果,并采用基于自映射监督循环一致性生成对抗网络(SMS-CycleGAN)的唇重构方法对多视角唇图进行角度分类及正面重构;然后设计两个异构三维卷积神经网络,分别用来描述音频和视频信号,并提取包含长时时空关联信息的三维卷积特征;最后引入对比损失函数作为音视频信号匹配的相关度鉴别度量,将音视频网络输出耦合到同一表示空间,并进行一致性判别。实验结果表明,文中方法能重建出更高质量的正面唇图,一致性判别性能优于多种不同类型的比较方法。 相似文献
5.
在挑战/响应方案的基础上,结合安全单向Hash函数提出了一种基于口令的、安全的动态认证方案,用户不需改变使用口令认证的习惯,而认证方案比传统的基于口令的方案更为安全。通过Random Oracle模型分析,证明了只要选取安全的单向Hash函数,现提出的基于口令的动态认证方案是安全的。 相似文献
6.
改进覆盖树与标识网死锁的检测 总被引:1,自引:0,他引:1
通过在ω符号中加入令牌数增减的信息,改进了原标识Petri覆盖树的构造方法,从而提出了一种新型的覆盖树,即改进覆盖树,这种覆盖树是有限的,它可以覆盖所有的可达标识,并且每一节点都有可达标识,这种覆盖树可单独用于检测标识网的死锁,文中示例表明它是有效的。 相似文献
7.
杨继臣;贺前华;徐益君;李艳雄 《华南理工大学学报(自然科学版)》2009,37(9)
针对BIC说话人改变检测中检测精度低,计算量大的问题,本文提出了一种快速准确的改进BIC说话人改变检测算法:通过提高可测度的方法来提高检测精度;在分析窗长度增加时,通过增加分析窗内第一个数据窗的长度来降低计算量;在寻找潜在改变点时,只在新增加的分析窗内计算和寻找;通过限制分析窗内第一个数据窗最大值的方法来解决长时间没有说话人改变点计算量不断增大的问题。实验结果表明该算法在不影响说话人改变检测的总准确率的基础上提高了检测精度,节省了计算量。 相似文献
8.
为解决多AGV在复杂系统中的任务调度问题,以提高生产效率缩短任务周期为目标建立地面轨迹模型和AGV搬运耗时模型。采用优化的模糊决策算法通过最小化每台AGV的搬运耗时来最小化搬运作业的总耗时。在算法设计过程中,采用分布式控制思想,将AGV离目标点的距离,AGV的当前载重和AGV的当前电量作为因素集,将AGV执行此次搬运任务的合适度作为评价集,建立AGV模糊评价模型;通过该模型得出各台AGV对任务适合度的评价向量进而寻找一种映射将评价向量转化为值,调度问题被转化为最优化问题,其中采用切割补偿优化综合模型的因素权重选择,采用分模式链式比较减少AGV的计算量。通过多次仿真实验,可以验证本文算法在缩短任务的执行周期上具有一定的可行性与有效性,并且在解决复杂系统AGV状态多变的调度问题下展现了一定的鲁棒性和拓展性。 相似文献
9.
奉小慧;贺前华;王伟凝;严乐贫 《华南理工大学学报(自然科学版)》2010,38(2)
针对面向唇读的level set模型在嘴唇分割中存在边界过收敛和过早收敛的问题,本文提出一种改进的基于先验知识的水平集模型(Prior Shape -level set,简称PS-level set)来进行嘴唇几何形状的定位。PS-level set模型利用改进的差值能量函数引入嘴唇形状的先验信息。在曲线演化过程中,反复比较曲线和先验曲线的差距,使曲线的演化形状逐渐逼近先验模型形状,更精确地收敛于目标物体实际轮廓。实验证明用PS-level set模型定位嘴唇几何形状的准确率比level set模型提高了8.38%。 相似文献
10.
提出了一种基于谐波-瞬时-残差感知子空间分解模型的音频特征提取方法.首先,根据心理声学的研究成果,提出了基于感知的谐波分子、瞬时原子和残差分布字典,可分别用于提取音频中的长时谐波成分、瞬时频率成分和残差谱分布特性;随后,利用该字典和匹配追踪算法,将音频信号分解到谐波子空间、瞬时子空间和残差子空间这三个感知子空间;最后,通过融合各子空间的特征参数生成音频特征.实验表明:在15类音效分类任务中,所提出的特征比传统梅尔频率倒谱特征准确性提升9.1%,比基于传统匹配追踪的特征提升8.3%. 相似文献