首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
汉语语音识别中对孤立词、小词汇特定人的语音识别率较高,但对于连续的大词汇量语音识别率较差。把连续的大词汇语音实时自动地切分为单个音节,可以提高其系统的识别率。本文根据汉语语音在能量和频率等方面的特征,找到了短时平均幅度和短时平均过零率的方法来检测音节的端点,从而得到对文本文件中汉语语音的音节自动切分算法。  相似文献   

2.
选用倒谱特征、△倒谱特征、能量类特征等个语音信号特征,采用多码本和HMM/VQ技术实现非特定连接数字语音识别。在识别阶段,使用帧同步型网络搜索识别算法结合模糊切分实现非特定人连接数字语音识别。数字串识别准确率达到81%以上,而数字识别准确率更高,达到94.4%。  相似文献   

3.
采用模糊切分实现非特定人连接数字语音识别   总被引:1,自引:0,他引:1  
选用倒谱特征、△倒谱特征、能量类特征等多个语音信号特征,采用多码本和HMM/VQ技术实现非特定人连接数字语音识别。在识别阶段,使用帧同步型网络搜索识别算法结合模糊切分实现非特定人连接数字语音识别。数字串识别准确率达到81%以上,而数字识别准确率更高,达到94.4%。  相似文献   

4.
针对传统端点检测算法因忽视语言特点导致的检测精度不足问题,结合元音中心论、响度说、合张运动说等俄语音节理论,提出一种面向俄语语音的音节端点检测算法.算法利用共振峰能量检测元音,并根据元音动态调整门限,基于短时过零率和能熵比提取和切分音节.算法在元音检测中查准率为84.9%,查全率为87%,音节切分的正确率为78.6%,端点检测精度为91.6%,较传统算法剔除了音节间的无话帧,提高了端点检测的精度.  相似文献   

5.
为提高汉语连续语音识别系统的性能,建立了音节间相关的半音节识别单元,并研究了基于这种单元的连续语音识别算法。讨论了基于 D D B H M M 模型和最大后验概率估计准则的连续语音识别的理论基础,依据动态规划的基本原理,提出了一种基于音节间相关的识别单元的汉语连续语音识别算法。依照这种算法,不但能得到最优句子侯选,而且能够在识别过程中得到音节格(即 Nbest句子侯选)的数据结构。最后通过大词汇量非特定人连续语音识别的实验,表明了采用音节间相关的识别单元比基本的识别单元误识率有明显的降低  相似文献   

6.
语音分割是苗语语音基础研究的难点和热点问题,其本质是苗语语音音节与沉默段(静音、噪音)之间边界模糊问题,目前相关研究成果较少。针对苗语语音音节分割边界模糊问题,以时域特征分割获得初始的语音边界,通过构建语音音节边界优化评价函数模型,将音节与沉默段之间边界模糊问题转化为音节真实边界和算法预测边界的误差极小化问题,以精英策略保留算法最佳优化分割边界种群个体,提取苗语语音音节与沉默段间的精准边界。实验结果表明,所提方法能显著提高苗语语音音节自适应边界搜索能力。此外,所提自适应分割算法在语音分割模糊边界分割方面显著优于典型的语音分割算法。  相似文献   

7.
针对人为设定最优采样延迟不能客观反映信号采样延迟和固定相关维数不易描述病变异常语音复杂性的缺陷,文中提出一种基于相关维数的病变连续语音检测算法.该算法在语音信号合理采样延迟区间内不断调整采样延迟,搜索使正常语音与病变连续语音的区分等错误率达到最小的嵌入相关维数,以避免设定采样延迟的缺陷.同时,通过将相关维数曲线划分成子区间,并判定子区间的稳定性,以达到不固定嵌入相关维数的目的.最后,对每个合理采样延迟时间内获取的训练语音的最优相关维数进行等错误率分析,选用具有最小等错误率的相关维数及对应的采样延迟为文中混沌参数,为测试语音提取混沌指数进行正异常区分.实验结果表明,该算法的区分正确率为75.6%,分别比GMM-SVM、Shimmer、固定相关维和采样延迟法、SHR算法和Jitter算法提高7.8%、9.3%、16.0%、18.0%和20.4%.  相似文献   

8.
基于组合神经网络和模糊聚类的话者分类   总被引:2,自引:0,他引:2  
基于话者分类的自适应语音识别是实现非限定人、大字表语音识别的一种很有前途的有效方法.本文设计了一种用于话者分类的主从式组合神经网络,以神经预测模型作为从网络,可以从短语音(一个音节,约0.3秒)中有效地提取、规正和压缩话者个人性信息;主网络采用具有很强聚类功能的自组织特征映射网络.针对话者个人性信息的模糊性,提出了模糊系统聚类算法和双类心聚类算法.实验验证了组合神经网络对于话者分类的有效性以及模糊聚类算法对不同文本的语音样本具有较好的适应性  相似文献   

9.
大多数去混响的算法都是基于短时分析,不可避免地带来了截断效应;如果对混响语音进行逆滤波,则要求房间冲激响应满足最小相位.本文提出了一种针对单通道的语音长时分帧的去混响算法.算法采用长时帧分析,有效减小了截断效应的影响.首先对混响语音信号进行长时分帧计算其最小相位分量倒谱,然后根据纯净语音和房间冲激响应倒谱的不同分布,在倒谱域阻带滤波得到去混响语音最小相位分量的估计,根据最小相位倒谱理论,进而可以估计出去混响语音频域的模,最后利用人耳对相位信息的不敏感性,用估计的去混响语音的模和混响语音的相位合成,傅里叶反变换得到去混响语音时域波形.实验表明,该算法有良好的去混响效果.  相似文献   

10.
手写体信函地址汉字切分   总被引:3,自引:0,他引:3  
目前多数汉字识别系统仍基于单个汉字的逐个识别,因此对字符进行有效的切分,是离线汉字识别的一项重要工作,根据汉字手段写体的特点,在方差最小原理基础下,提出多步切分算法(粗分-细分-合并)和穿越算法,首先根据字段间间隔,用最小距离聚类的方法,得到5组粗分结果,从中选出最接近理想的一种,用改变类间距离和穿越算法,对较宽的字段进行细分,最后将过细的分割部件合并成一个完整的字,对现场采集的3000封信函进行切分,单字正确率可达90.8%。  相似文献   

11.
终端区飞机排序的人工蜂群算法   总被引:3,自引:0,他引:3  
摘 要:为缓解终端区空中交通压力,研究了人工蜂群算法在终端区飞机降落排序中的应用。建立以航班总延误时间最小为目标函数的规划模型,运用人工蜂群算法,对着陆飞机排序问题进行了仿真计算,并与先到先服务算法、模拟退火算法、蚁群算法进行了对比研究。仿真结果表明:在双跑道模型下,人工蜂群算法比先到先服务算法,延误减少了48%。与模拟退火算法和蚁群算法相比,人工蜂群算法求解的结果最优且用时最少。说明应用人工蜂群算法求解终端区飞机排序问题是可行的。  相似文献   

12.
由于血管截面有可能出现凹状,导致种子点位置偏移到血管外,造成分割结果出现错误.为解决该问题,提出一种基于最小生成树的种子点选取算法.利用前一帧分割结果随机取点,并保证随机点均匀覆盖整个分割区域;再运用Kruskal算法对所有随机点构建最小生成树,并以最小生成树的树重心作为当前帧的种子点;最后以区域生长算法对当前帧进行分...  相似文献   

13.
针对常用二维直方图区域直分法存在错分的问题,并为适应实际中不同图像及分割目的的需要,提出了更具普适性的二维直方图θ 划分最小误差阈值分割方法(θ为分割直线的法线与灰度级轴的夹角).导出了相应的阈值选取公式及其快速递推算法,根据实验结果分析了θ取值对分割结果和算法运行时间的影响.与二维直方图直分最小误差法相比,所提方法的分割结果更为准确,抵抗噪声更为稳健,且所需运行时间也大为减少;而直线形最小误差法只是文中方法中θ=45°的特例.  相似文献   

14.
针对车载视觉行人目标分割由于复杂场景对行人目标的分割结果产生干扰而出现信息冗余以及错误分割的问题,提出一种粗细粒度超像素行人目标分割算法。该算法以Mask R-CNN作为粗粒度一次分割,将所得结果经Slic超像素细粒度二次分割,融合两次输出结果来提高现有图像目标的分割精度,为行人目标识别和跟踪提供有益先验感知信息。经仿真验证,该算法能够对复杂背景情况下的图像进行有效分割,MS COCO标准公开集测试结果与原有Mask R-CNN检测算法相比,mAP提高0.71%,为图像识别和计算机视觉系统完成精准的预处理,具有较强的工程应用价值。  相似文献   

15.
针对超声信号高度相关性的特点,提出了一种最小方差的延时乘累加波束形成(MVDMAS)算法.首先,该算法利用最小方差波束形成的思想,计算接收回波信号的权值,用来降低回波信号的旁瓣;然后,对加权处理后的回波信号进行组合乘累加运算,降低回波信号之间的相关性;最后,理论推导和实验仿真验证了算法的有效性.仿真实验结果表明,MVDMAS算法的成像对比度和分辨率均有一定提升,可有效地降低主瓣宽度、旁瓣高度和抑制斑点噪声.与延时叠加、最小方差和延时组合乘累加波束形成算法相比,综合评价指标CR和CNR分别提高了100.24%,33.91%,17.41%和30.61%,17.55%,11.36%.  相似文献   

16.
基于二维灰度直方图的最小模糊熵分割方法   总被引:2,自引:0,他引:2  
本文在一维最大模糊熵分割方法的基础上,根据图像目标和背景内部像素灰度值的一致性和集中性,提出了一种新的图像分割隶属度函数,从而得到最小模糊熵分割方法.本文还针对传统的基于一维灰度直方图的模糊熵分割方法不能反应图像的空间信息,抗噪声能力差的缺点,提出了基于二维灰度直方图的模糊熵分割算法.本实验结果证明,最小模糊熵分割方法对于某些图像的分割效果要好于最大模糊熵分割效果,而二维分割方法对于绝大多数图像,都具有很强的鲁棒性和抗噪能力,分割效果明显优于一维的方法,而且方便地推广到其他的一维熵分割方法中。  相似文献   

17.
一种P2P流媒体数据传输任务分派算法   总被引:8,自引:0,他引:8  
定义了P2P流媒体数据传输的数学模型,提出了一种具有最小缓冲延迟的P2P流媒体数据传输任务分派算法MBADP2P,算法考虑已分派/待分派资源块情况、当前网络中各节点可提供的出口带宽和各资源块实际产生的缓冲延迟,将待分派资源块动态测试分派到相关节点,计算出具有最小缓冲延迟的传输分派方案.算法可根据网络环境的变化动态调整任务分派方案,更适合于实际的应用环境.测试结果显示,在非特定假设情况下,该算法的缓冲延迟小于其他已知的任务分派算法.  相似文献   

18.
牙颌隐形矫治中要求对STL格式牙颌模型边界进行准确、高效地分割。针对这一要求,本文对传统的交互标记分割算法进行了改进:由单面片输入改为区域选择,用相邻两面片的弯曲程度函数作为对应的高度场函数,由排序进栈优化为直接插入队列。该算法实现了目标牙齿的快速、自动分割。结果表明,改进算法分割的牙冠更完整,效率更高,能够满足矫治要求。  相似文献   

19.
针对传统汉字切分方法中对粘连汉字和重叠汉字切分不准确的问题,提出了基于极小阈值和曲线拟合的垂直投影汉字切分算法.该算法在传统垂直投影法汉字切分的基础上结合极小阈值和曲线拟合进行切分,实验结果表明:相对于传统汉字切分方法,该算法对含有粘连和重叠现象的手写体汉字文本的切分是有效的,从而可使手写体汉字的切分准确率有较大的提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号