排序方式: 共有27条查询结果,搜索用时 31 毫秒
1.
针对贝叶斯信息准则(BIC)算法在说话人改变检测中计算量大、检测精度低的问题,文中提出了一种改进的BIC说话人改变检测算法.该算法通过限制分析窗内第一个数据窗的最大长度来降低计算量,并通过增加分析窗内第二个数据窗的有效长度(提高可测度)来提高检测精度;同时,该算法只在新增区间内寻找潜在说话人改变点,从而解决了长时间无说话人改变时计算量不断增大的问题.实验结果表明,该算法和传统的BIC算法相比,偏移误差范围由0.10~0.80降低到0.03~0.20;当分析窗长为40s时,计算时间节省了约75%. 相似文献
2.
对于英语等"重音节拍语言",词重音是一个非常重要的韵律学特征、提出巴克谱子带能量(BSSE),巴克谱子带倒谱(BSSC)和巴克倒谱(BSCC)等三种使用子带方法,模拟人类听觉系统进行英语词重音检测的新特征.首先研究了在英语词重音检测中不同频带的贡献度,然后测试了在连续语音条件下使用这些特征的系统性能.试验结果表明,高频带对重音识别的贡献度比其它频带大,新特征的识别效果也比传统特征好. 相似文献
3.
基于并行基因算法的语音识别方法 总被引:1,自引:0,他引:1
提出一种基于并行基因算法的孤立字识别时间规正算法,该算法是在[3]的基础上提出,可解决动态时间规划(DTW)难以解决的一些问题:①使距离归一化因子M与实际路径相关;②以自然方式提供多条最佳规划路径;③语音端点检测正确性对识别率的影响得到一定程度的改善。建立了试验数据库,根据试验数据建立了模板距离遵循正态分布的算法性能分析模型。比较了并行基因算法,串行基因算法[3]和动态时间规划算法的性能。试验结果表明:基因算法比动态时间规划能得到更高的识别率,在单CPU情形下,虽然并行基因算法的性能比串行基因算法略微提高,但至少可节约三分之一的CPU时间 相似文献
4.
改进覆盖树与标识网死锁的检测 总被引:1,自引:0,他引:1
通过在ω符号中加入令牌数增减的信息,改进了原标识Petri覆盖树的构造方法,从而提出了一种新型的覆盖树,即改进覆盖树,这种覆盖树是有限的,它可以覆盖所有的可达标识,并且每一节点都有可达标识,这种覆盖树可单独用于检测标识网的死锁,文中示例表明它是有效的。 相似文献
5.
杨继臣;贺前华;徐益君;李艳雄 《华南理工大学学报(自然科学版)》2009,37(9)
针对BIC说话人改变检测中检测精度低,计算量大的问题,本文提出了一种快速准确的改进BIC说话人改变检测算法:通过提高可测度的方法来提高检测精度;在分析窗长度增加时,通过增加分析窗内第一个数据窗的长度来降低计算量;在寻找潜在改变点时,只在新增加的分析窗内计算和寻找;通过限制分析窗内第一个数据窗最大值的方法来解决长时间没有说话人改变点计算量不断增大的问题。实验结果表明该算法在不影响说话人改变检测的总准确率的基础上提高了检测精度,节省了计算量。 相似文献
6.
针对传统音唇一致性判别方法主要对正面唇动视频进行处理,未考虑视频采集角度变化对结果的影响,且容易忽略唇动过程中的时空特性等不足,文中以唇部角度变化对一致性判别的影响为研究重心,结合三维卷积神经网络在非线性表示和时空维度特征提取上的优势,提出了基于正面唇重构与三维耦合卷积神经网络的多视角音唇一致性判别方法。该方法先通过在生成器中引入自映射损失来提高正面重建效果,并采用基于自映射监督循环一致性生成对抗网络(SMS-CycleGAN)的唇重构方法对多视角唇图进行角度分类及正面重构;然后设计两个异构三维卷积神经网络,分别用来描述音频和视频信号,并提取包含长时时空关联信息的三维卷积特征;最后引入对比损失函数作为音视频信号匹配的相关度鉴别度量,将音视频网络输出耦合到同一表示空间,并进行一致性判别。实验结果表明,文中方法能重建出更高质量的正面唇图,一致性判别性能优于多种不同类型的比较方法。 相似文献
7.
在挑战/响应方案的基础上,结合安全单向Hash函数提出了一种基于口令的、安全的动态认证方案,用户不需改变使用口令认证的习惯,而认证方案比传统的基于口令的方案更为安全。通过Random Oracle模型分析,证明了只要选取安全的单向Hash函数,现提出的基于口令的动态认证方案是安全的。 相似文献
8.
奉小慧;贺前华;王伟凝;严乐贫 《华南理工大学学报(自然科学版)》2010,38(2)
针对面向唇读的level set模型在嘴唇分割中存在边界过收敛和过早收敛的问题,本文提出一种改进的基于先验知识的水平集模型(Prior Shape -level set,简称PS-level set)来进行嘴唇几何形状的定位。PS-level set模型利用改进的差值能量函数引入嘴唇形状的先验信息。在曲线演化过程中,反复比较曲线和先验曲线的差距,使曲线的演化形状逐渐逼近先验模型形状,更精确地收敛于目标物体实际轮廓。实验证明用PS-level set模型定位嘴唇几何形状的准确率比level set模型提高了8.38%。 相似文献
9.
鉴于传统共源共栅低噪声放大器由于受共栅级的影响.其噪声和线性度都不理想,为此在共栅级上引入一对交叉耦合电容和电感,以消除共栅级的噪声并提高放大器的线性度.采用特许半导体公司0.25μm射频互补金属氧化物半导体工艺进行了设计.仿真结果表明低噪声放大器在2.4 GHz处的噪声系数仪有1.34dB.该电路能够提供17.27 dB的正向增益、小于-38.37 dB的反向传输系数、小于-27.73 dB的输入反射系数、小于-15.85 dB的输出反射系数,该放大器的三阶交调点为0.58 dBm.消耗的功率为11.23 mW. 相似文献
10.
提出了一种用于提高网桥地址查找速度的哈希算法,给出了具体的哈希算法实现函数,分析了其在网桥上应用的效率。同时也介绍了基于哈希算法实现网桥地址维护的详细流程,包括源地址自学习,源地址过期监测以及目的地址过滤,通过结合使用地址过期标志和地址有效标志,有效提高了网桥地址维护的效率,节省了硬件资源。 相似文献