首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 70 毫秒
1.
一种基于段间距离测度的语言自动分割方法   总被引:5,自引:0,他引:5  
根据连续语音中不同类语音段之间内在的相异性,提出了段间距离的概念,并基于特征矢量距离给出了段间距离的一种测度。在此基础上,提出一种新的语音自动分割方法,它根据语音段间距离曲线的峰值点对语音音素进行分割,而不需要关于语音单元的先验知识或参考模型,在该方法中,语音特征矢量按帧计算,通过采用适当的帧重迭度,可以使语音分割具有较高的时间分辨率,实验结果表明,该方法具有较高的分割精度和速度。  相似文献   

2.
一种基于分形理论的语音分割新方法   总被引:1,自引:0,他引:1  
语音是由混沌的自然音素组成的,而分形可以很好地为成混沌状态的自然音素建模.语音波形具有分形特征,将分形用于改善语音识别技术越来越受到重视.语音的特性决定了每一个音素展现其固有模式,因此相邻音素之间的分维值不同.通常求取语音波形的分维值轨迹可把人的发音分割成句子、词、甚至音素.实验证明,该方法在语音分割中取得了很好的效果.  相似文献   

3.
汉语语音音素分割的一种新方法   总被引:3,自引:0,他引:3  
音素分割在大词汇量连续语音识别的过程中起着重要的作用 .该文提出了一种简单实用的音素分割方法 ,比较好地解决了这个问题 ,并在大词汇量汉语语音识别中得到了应用 ,取得了较好的结果  相似文献   

4.
SAR图像中斑点噪声的存在给分割造成了严重的影响.为此,基于JSEG平台,针对高分辨率SAR图像的特点,提出了一种新的相似性度量,这也是该无监督分割算法的核心.该算法主要由预处理、纹理组合和区域生长三个步骤来完成.在纹理组合中,利用新的相似性度量标准,把预处理后的SAR数据通过计算映射成一组新的数据,这组新数据可初步表征图像的分割;最后利用简单的区域生长完成分割.实验结果表明,该方法充分利用了SAR图像的特征信息,能够准确实现对SAR图像的分割,并具有很好的稳健性.  相似文献   

5.
针对图像分割有监督学习模型训练时间长、需要大量训练样本才能确保模型精度要求且样本标记费时费力的问题,提出了在不同色域空间下基于神经网络的无监督图像分割方法。首先将图像进行不同颜色空间模型转化,得到不同色域空间下图像的颜色表示;其次利用felz和quickshift方法,对转换后的图像进行粗粒度聚类,形成超像素结果,并对每个像素打上相应的标签;最后利用神经网络细粒度的图像特征分辨能力进行微调,得到最终的图像分割结果。该方法在公开的COD10K等数据集上选取了数据集进行验证,实验表明,文中方法能够对图像进行合理分割,且与有监督长时间训练过程相比,无监督的推理耗时大大缩短,速度显著提高。  相似文献   

6.
汉语孤立词声韵分割算法的研究   总被引:2,自引:0,他引:2  
文章从汉语语音评价系统设计的需要出发,针对DTW算法和汉语音节的特点,研究并实现了汉语音节中声母和韵母分割的两种算法,算法依据的基础都是依据不同类语音段数据相异的原理.在实际系统测试中,发现基于段间距离的分割算法取得了良好的实验结果,可以作为汉语语音评价系统中的声韵分割算法.  相似文献   

7.
针对目前基于模糊C-均值聚类图像分割算法的噪声敏感问题, 提出一种基于无监督可能性聚类的自动加权图像分割算法. 该算法先应用均值漂移迭代确定可能性C-均值聚类算法的初始化中心, 利用可能性聚类的模式搜索性质自动确定聚类划分; 然后根据像素间灰度值关系进行图像加权, 通过将加权系数与像素噪声的可能性相关联, 降低噪声对图像分割的影响. 实验结果表明, 相对于基于模糊C-均值聚类的图像分割算法, 该算法不仅取得了较好的分割效果, 而且无监督分割时计算效率更高, 对噪声的鲁棒性更强.  相似文献   

8.
介绍了一个新颖的无监督分割方法,这种方法依赖于一个通用的图像邻域的非参数统计模型,直接建模图像邻域,不用建立中间特征.它不是针对某种特定纹理,而是通用在各种纹理上.文章通过静态随机域和非参数的高阶统计模型探讨了图像纹理的基本描述.文章中提到了适合各种纹理的通用的公式.方法的思想是通过最小化图像邻域的概率密度函数的熵来给出最优分割.熵的最小化使用了一种快速的水平集方案.这种方法并不依赖于学习阶段的数据,是无监督的.根据数据的信息内容自动调整内部一些重要参数.  相似文献   

9.
针对目前基于模糊C-均值聚类图像分割算法的噪声敏感问题, 提出一种基于无监督可能性聚类的自动加权图像分割算法. 该算法先应用均值漂移迭代确定可能性C-均值聚类算法的初始化中心, 利用可能性聚类的模式搜索性质自动确定聚类划分; 然后根据像素间灰度值关系进行图像加权, 通过将加权系数与像素噪声的可能性相关联, 降低噪声对图像分割的影响. 实验结果表明, 相对于基于模糊C-均值聚类的图像分割算法, 该算法不仅取得了较好的分割效果, 而且无监督分割时计算效率更高, 对噪声的鲁棒性更强.  相似文献   

10.
一种基于自适应阈值的图像分割算法   总被引:33,自引:0,他引:33  
为提高目标检测概率,针对复杂的地面目标红外亚图像,提出了一种以最大类间方差法为基础的自适应阈值图像分割方法。用分割出的目标和背景区域的灰度统计量,设计了一个判断是否得到正确分割的准则.理论分析和实验结果表明,对于复杂背景下低对比度、低信噪比的地面目标,不论目标在图像中所占面积大小,利用该方法均可得到正确的分割结果.通过设置阈值运算的灰度取值范围,可大大减少计算量,节省处理时间.  相似文献   

11.
当前非定特人语音识别算法大多只适于连续语音,且识别精度和速度均较低。为此,提出一种新的基于BP神经网络的非特定人语音识别算法,介绍了标准BP神经网络,针对其收敛速度慢的弊端,通过变化的自适应学习速率,令网络训练针对各种阶段自行设置学习速率值,利用变学习速率构建对应的改进BP神经网络模型,将改进的BP神经网络模型看作识别非特定语音的识别器,输入待识别语音,令累计预测残差达到最小,实现非特定人语音识别。将改进模型应用于非特定人语音识别中进行验证,结果表明所提算法识别率更高、识别速度更快,不仅适于连续语音的识别,也适于不连续语音的识别。  相似文献   

12.
针对传统的手机电话语音的说话人确认中,未考虑训练语音和测试语音信号本身质量对识别效果的影响问题,采用语音质量测量的方法对GMM-UBM方法进行改进,提出了利用多维基音参数,将基音偏离作为语音信号质量测量准则的方法,对GMM-UBM系统短时谱参数评分过程进行修正,得到基于语音信号质量的评分方法.通过在NIST SRE 2006 1side数据库中男性话者的实验表明,采用语音质量的评分方法能够有效提高系统的识别率,系统的等误识率和检测代价函数都有一定程度的改进.  相似文献   

13.
一种新的基于区域生长的彩色图像分割算法   总被引:1,自引:0,他引:1  
为克服一般区域生长算法对初始种子点选择以及生长顺序鲁棒性较差的问题,提出了一种鲁棒于生长顺序的彩色图像区域生长算法.首先计算所有像素点的局部颜色直方图以及领域相似性指标(neighbor similarity factor,NSF);其次通过NSF值建立种子的选取准则、种子的生长准则以及生长的终止准则,对图像进行初分割;最后对未分类点进行重新分类得到最终分割结果。通过与JSEG算法比较发现,该算法在运算时间以及分割准确性具有明显优势。  相似文献   

14.
息肉图像的分割在临床医疗和计算机辅助诊断技术等领域具有广泛的研究和应用价值,但是就目前的研究和应用需求来看,准确的息肉分割仍然是一项挑战. 针对内窥镜息肉图像中出现的息肉与黏膜边界不清晰、息肉的大小和形状差异较大等影响分割质量的问题,该文提出了一种基于U-Net改进的息肉图像分割算法(SBF-Net). 首先,在U-Net架构上引入了边界特征加强模块(BFEM),考虑到息肉边界和内部区域的关键线索,该模块利用编码器高层特征生成额外的边界补充信息,在解码器阶段进行融合,提升模型处理边界特征的能力. 其次,该模型的解码器(GFBD)采用了从上至下逐步融合特征的方式,将编码器阶段的输出特征经过局部加强(LE)模块之后再逐步融合边界特征,这种多尺度特征融合方式有效缓解了编码器和解码器之间的语义差距问题. 最后,在后处理阶段采用测试时数据增强(TTA)来进一步对分割结果进行细化. 该模型在CVC-300、CVC-ClinicDB、Kvasir-SEG、CVC-ColonDB和ETIS-LaribPolypDB等5个公开数据集上进行了对比实验和消融实验,实验结果证明了该文所改进方法的有效性,并在内窥镜息肉图像上表现出更好的分割性能和更强的稳定性,为息肉图像的处理和分析提供了新的参考.  相似文献   

15.
不同尺度的图像拥有不同的特性,针对单一尺度图像进行分割容易出现过分割或欠分割的问题,本文提出一种基于多尺度分析的归一化割的图像分割方法,首先利用方向能量模型得到不同尺度子图像的边缘方向能量,然后根据干涉轮廓的思想建立各个子图像像素之间的相似度,形成多个不同尺度的权值矩阵,并归一化为一个权值矩阵,最后运用归一化割算法对图像进行分割。实验表明,本文方法在融合了多个尺度图像不同特性的同时,能很好地处理含有纹理区域和弱边缘的图像,在一定程度上避免了过分割或欠分割的问题。  相似文献   

16.
针对基于局部熵的过渡区阈值算法中没有同时考虑局部图像灰度变化的频率和幅度,提出一种融合局部描述子的过渡区阈值算法.提出算法首先采用图像的局部熵和局部方差等局部描述子提取图像的局部特征;其次融合局部图像特征构造特征矩阵,并选取合适的特征阈值提取图像的过渡区;最后根据图像过渡区的灰度均值分割图像.实验结果表明,根据一些图像分割的定量评价标准,提出算法提取过渡区的质量高,分割图像效果好.  相似文献   

17.
一种基于G.729语音编码的改进算法   总被引:1,自引:0,他引:1  
共轭代数码本激励线性预测(CS,ACELP)语音编码算法在8kb/s速率上获得了比较理想的质量,是以10ms为一短时语音帧作为处理对象.基于CS.ACELP语音编码算法,以20ms为一语音帧,在编码器中引入脉冲散布技术,提出了一种使码速降低至4kb/s的散布脉冲代数码本激励线性预测(PD—ACELP)编码算法.经仿真实验及主观听觉测试表明,这种算法的合成语音质量还是比较令人满意的.  相似文献   

18.
基于浊音语音谐波谱子带加权重建的抗噪声说话人识别   总被引:1,自引:0,他引:1  
提出了一个基于浊音语音谐波谱重建的说话人识别算法.该算法根据浊音语音短时频谱的结构特征和基音信息,对浊音语音谐波结构频谱进行子带加权重建,以补偿由噪声引起的训练与测试条件的失配.算法基于重建浊音频谱提取感知线性预测倒谱系数,与基音相组合作为说话人的语音特征参数矢量,采用高斯混合模型对说话人进行建模.仿真实验的结果表明:所提出的浊音谱重建方法对多种类型含噪语音的噪声补偿均具良好效果,可以明显提高在噪声环境下的与文本无关的说话人识别的识别率,特别是显著提高低信噪比环境下的识别率,而不会明显降低纯净语音和高信噪比环境下的识别率.  相似文献   

19.
20.
对于大规模的语音语料,语音切分方法主要有传统的人工切分和机器自动化切分2种方式.人工切分大规模语音语料的切分质量易控制,但效率低、成本高;机器自动化切分效率高,但后期查找切分错误时任务极其繁重.因而提出一种人机交互语音切分系统,切分人员可选择自动切分算法,设置切分参数,修改有问题的自动切分结果,同时可自动生成用于HTK训练的标注文件.以课题组采集的1 000个普米语语音文件为研究对象,以普米语孤立词为切分基元,机器自动化切分存在难以避免的切分错误,后期检查时工作量巨大;然而使用本文提出的人机交互语言切分系统进行切分,切分人员在无需高认知度的情况下也可做到近100%的切分正确率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号