首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 206 毫秒
1.
拼音到汉字自动转换技术的改进与实现   总被引:1,自引:0,他引:1  
拼音到汉字转换一直是中文信息处理研究的一个重要方面。在前人的基础上改进了他们所使用的数据平滑算法,给出了两种应用于不同场合的公式,使得在结果中能够得到不同要求的解。同时,给出了利用隐马尔可夫模型(HMM)来设计实现这样一种转换,并且利用Viterbi算法来对模型进行求解的设计细节与方法。最后利用随意选择的语料库来对计算机进行训练学习并给出了测试结果,同时分析了错误结果的原因。  相似文献   

2.
带拼音纠错的汉语音字转换技术   总被引:3,自引:0,他引:3  
提出了一种基于统计和规则的混合方法来实现汉语音字转换。利用汉语的语法规则,在统计语言模型中采用了两种基于词和词性的混合语言模型。在实验中,将这两种混合语言模型与基于词的语言模型进行了比较。实验证明,在语言模型中引入词性后,提高了音字转换正确率。考虑了出现拼音错误时的音字转换问题,提出了一种拼音纠错方法来纠正错误。实验证明,当拼音正确率高于85%时,这种带纠错的音字转换方法可以提高音字转换正确率。  相似文献   

3.
为提高基于二元判决的N雷达分布式检测算法在各个雷达的信噪比未知且可能时变条件下的检测性能,提出了基于局部N门限量化的分布式检测算法和衡量不同检测算法性能的一般性方法。仿真结果表明:该算法性能优于各种基于"N选k"融合的检测算法,在特定情况下比基于OR融合的方案有2-2.5dB的信噪比改善,相对于极大似然准则下的集中式检测器的信噪比损失不到0.8dB。在各个传感器的信噪比差异明显时,和基于OR融合的方法有同样的稳健性,因而是一种稳健且高性能的检测算法。  相似文献   

4.
针对常规定位方法在空间非均匀高斯噪声背景下近场声源定位性能下降的问题,基于平面阵建立了近场声源信号模型,推导了空间非均匀阵元噪声条件下求解声源方位和距离信息的最大似然定位方法,并使用连续空间蚁群优化算法,解决了该最大似然方法在多维参数空间搜索的高运算复杂度问题,通过仿真实验验证了该方法的可行性和有效性.仿真实验表明,该方法估计精度较高,在低信噪比下方位和距离均方误差都小于常规最大似然方法,并且在高信噪比条件下方位和距离的均方误差都逼近克拉美-罗界.  相似文献   

5.
针对常规定位方法在空间非均匀高斯噪声背景下近场声源定位性能下降的问题,基于平面阵建立了近场声源信号模型,推导了空间非均匀阵元噪声条件下求解声源方位和距离信息的最大似然定位方法,并使用连续空间蚁群优化算法,解决了该最大似然方法在多维参数空间搜索的高运算复杂度问题,通过仿真实验验证了该方法的可行性和有效性.仿真实验表明,该方法估计精度较高,在低信噪比下方位和距离均方误差都小于常规最大似然方法,并且在高信噪比条件下方位和距离的均方误差都逼近克拉美-罗界.  相似文献   

6.
目前多输入多输出(multiple-input multiple-output,MIMO)技术已经被电力线通信(power line communication,PLC)系统采用,但由于MIMO PLC系统噪声呈非高斯分布而且各端口噪声之间存在相关性,故不能直接采用无线系统中的MIMO检测算法。采用了二元Middleton class A分布对MIMO PLC系统中噪声进行建模,提出了基于该噪声分布的最大似然检测改进算法,由于改进最大似然检测算法实现复杂度高,为了便于实现,进一步提出了用近似函数降低复杂度的2种次优的检测算法,优化了算法复杂度。仿真结果表明,与传统的基于高斯噪声分布的最大似然检测算法相比,提出的基于二元Middleton class A类噪声分布的信号检测算法在MIMO PLC系统能获得更好的性能。在性能损失较小的情况下,次优算法的复杂度明显低于最大似然检测改进算法。  相似文献   

7.
随着随机模型的广泛应用,关于随机效应模型的参数估计一直是线性模型的最活跃的研究方向之一。我们经常估计这类模型的固定效应和方差成分。我们使用极大似然估计作为估计方差成分的一种技巧,为了考虑到估计固定效应时的自由度的损失,我们又会使用限制极大似然估计。计算方差成分的ML或者REML估计时,有很多迭代算法可以使用。我们关心的是Fisher得分法和EM算法应用到随机效应模型的方差成分上,通过使用这两种算法对随机效应模型的方差成分的极大似然估计和限制极大似然估计进行比较分析。本文给出EM算法用于求极大似然估计的具体公式补充证明,并对Fisher得分法在随机效应模型中的应用限制极大似然估计给予具体公式。  相似文献   

8.
Weibull分布在完全数据条件下的参数估计   总被引:1,自引:0,他引:1  
在完全数据条件下对Weibull分布,分别使用Newton-Raphson算法、CM算法进行完全数据Weibull分布参数的极大似然估计计算,并且在得到相应的迭代公式后,进行随机模拟,从模拟结果来分析这两种算法在处理Weibull分布参数的极大似然估计的优良性.  相似文献   

9.
一种运动目标的相干信号源DOA跟踪方法   总被引:1,自引:1,他引:0  
针对相干信号源方向时变的情况,分析了样本协方差矩阵的更新,在此基础上提出了一种基于粒子群算法的跟踪方法.该方法直接利用性能优越的最大似然估计器,避免了子空间跟踪类方法需要运用空间平滑等解相干技术对数据协方差矩阵进行的预处理和数据协方差矩阵不断分解的过程,同时通过锁定目标、大幅度缩小搜索的范围和运用群智能搜索有效降低算法的计算量.仿真结果表明,与子空间类算法相比,该方法具备解相干的能力和较好的跟踪精度,并且能够保证算法的实时性.  相似文献   

10.
传统的ARCH模型族在参数估计中使用的极大似然估计存在鲁棒性差和易收敛到局部最优解的缺点,为克服传统参数估计的上述缺点,提出了基于粒子群算法改进的智能算法,并利用粒子群算法对国内油价建立了AR(1)-ARCH、AR(1)-TARCH(1)模型.  相似文献   

11.
汉语盲文标调问题困扰了我国盲文界60多年,标调准确、篇幅增加、新旧衔接、学习负担等多种矛盾交织,盲文语料库为综合平衡地协调这些矛盾提供了可能性。以使用频率、辖字数、构词数、音节平衡指数、隐性标调指数等定量研究为基础,对盲人的阅读习惯、触觉品质等进行定性研究,广泛征求盲文使用者的意见和建议,有望形成符合盲人习惯、新旧衔接顺畅、兼顾汉语表音准确性和盲文简洁性的隐性标调方案。  相似文献   

12.
董蓉  袁俊  朱杰 《上海交通大学学报》2002,36(10):1529-1532
在普通话连续数字串的识别中,与传统HMM在持续时间模型上的错误假设有关的删除与插入错误所占比例可达24.23%。基于此,在Viterbi解码中引入持续时间模型信息。对多种带参函数分布的持续时间模型在理论和实验上的比较分析都证明了Gamma分布更能精确反映汉语字模型的持续时间特性。文中还在外惩罚模型的基础上提出预理分段内惩罚持续时间模型和全局内惩罚持续时间模型两种改进算法。实验表明,结合持续时间模型的语音识别算法可以有效地减少删除与插入错误率,使总体识别错误率比基带系统减少了47.74%。  相似文献   

13.
张磊  褚昆  郭黎利 《应用科技》2009,36(4):28-31
针对二元模型,提出了一种基于互信息的回退(MI Back-off)平滑算法.从互信息的角度,分析词之间的搭配关系,根据模型中每个二元对的互信息对其概率进行不同程度的折扣,并利用低阶模型对零概率事件进行补偿,通过极小化困惑度的原则体现新算法的合理性.在不同类别测试集下,该平滑算法与传统Katz平滑算法相比,模型困惑度下降均超过20%。  相似文献   

14.
深度神经网络技术在汉语语音识别声学建模中的优化策略   总被引:1,自引:1,他引:0  
将深度神经网络作为声学模型引入面向汉语电话自然口语交谈语音识别系统。针对自然口语中识别字错误率较高的问题,从语音的声学特征类型选择、模型训练时元参数调节以及改善模型泛化能力等方面出发,对基于深度神经网络的声学模型建模技术进行了一系列的优化。针对训练样本中状态先验概率分布稀疏的情况,提出了一种状态先验概率平滑算法,在一定程度上缓解了这种数据稀疏问题,经平滑后,字错误率下降超过1%。在所采用的3个电话自然口语交谈测试集上,相对于优化前的深度神经网络模型,经过优化后的模型取得了性能的一致提升,字错误率平均相对降低15%。实验结果表明,所采用优化策略可以有效地改善深度神经网络声学模型性能。  相似文献   

15.
针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分,比较前后两次算出的分数从而选出更可靠的识别结果。实验表明,通过该方法将段长模型应用在识别过程中,可以显著提高识别系统的性能,大量减少识别结果中的插入错误。数据显示,该方法使识别系统的音节错误率下降了大约10%,识别系统最终的插入错误和删除错误都低于1%。  相似文献   

16.
外来词用字(或字母)的读音规范   总被引:3,自引:0,他引:3  
汉语中的外来词,有用汉字书写的,也有用字母书写的。从历时角度说,有些用于书写古代外来词的汉字的读音,在今天看来,则是一种毫无理据的特殊读音,是否保留,应该有个取舍的准则;从共时角度说,外来字母词与汉拼字母词并行,同一字母多种读音的现象不可避免,自然也应该设法解决。对于前者,笔者的建议是:换用符合古外来词读音的汉字,从而取消原用汉字的特殊读音。对于后者,笔者的建议是:汉拼字母词按汉语读音读,外来字母词按外语读音读,并促进外来字母词按“汉拼音译、汉字音译和意译”三种方式,逐步融汇于汉语系统。  相似文献   

17.
侗文方案基本上是可行的,但是未能兼顾到一些人口密集、文化影响大的侗族区域的语言事实,应增加小舌塞音、软腭浊擦音两个声母。同时,现代汉语借词的标音应统一到普通话的读法,避免各地官话读音差别造成的混乱,也有助于汉语拼音学习和普通话推广。  相似文献   

18.
提出针对汉语连续语音识别中的大型HMM进行修正。在模型中加入双词法约束,然后给出洁约束下的新的识别算法,新识别算法基于Viterbi算法和分层构筑思想之上。经实验测试,识别率有较大提高。  相似文献   

19.
为了帮助发音困难者障碍者和外语学习者矫正普通话发音错误,提出基于Mel频率倒谱系数(Mel frequencycepstrum coefficient,MFCC)特征比较和模拟退火-遗传算法(simulated annealing genetic algorithm,SAGA)的普通话音素评分模型。该模型采用动态时间弯折(dynamic timewarping,DTW)算法对普通话音素进行相似度比对,并基于SAGA评分机制对发音进行自动评分。本文对比了不同优化算法(SAGA和局部优化算法)、不同DTW算法对语音评分的影响。结果发现:SAGA评分模型下的音素评分正确率大于94%,远远优于局部优化算法。此外,在SAGA评分模型下,搜索路径为平行四边形的改进DTW算法具有最优的评分结果。因此,基于MFCC和SAGA的评分模型适用于普通话音素评分。  相似文献   

20.
为提高汉语连续语音识别系统的性能,建立了音节间相关的半音节识别单元,并研究了基于这种单元的连续语音识别算法。讨论了基于 D D B H M M 模型和最大后验概率估计准则的连续语音识别的理论基础,依据动态规划的基本原理,提出了一种基于音节间相关的识别单元的汉语连续语音识别算法。依照这种算法,不但能得到最优句子侯选,而且能够在识别过程中得到音节格(即 Nbest句子侯选)的数据结构。最后通过大词汇量非特定人连续语音识别的实验,表明了采用音节间相关的识别单元比基本的识别单元误识率有明显的降低  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号