首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
提出一种以词片为识别基元的特定位置后验概率网格方法,解决了语音检索中的集外词处理问题,实现开集语音文档检索。通过引入前端查询扩展技术生成多个候选查询以补偿语音识别过程带来的误差及用户输入误差。在检索过程中引入编辑距离权重来实现模糊查询,提高系统的查全率并增强系统鲁棒性。实验表明该方法在集外词处理和系统鲁棒性等方面优于传统方法。  相似文献   

2.
LSB隐写是将欲嵌入的秘密信息取代载体图像的最低比特位,是图像隐写最流行的方式之一。已经有大量算法来检测LSB隐写,但是对于图像最低位变化率的估计误差较大。探讨了一种基于后验概率的隐写分析算法:首先利用图像像素是否处于局部平滑区域进行建模,然后采用EM算法估计出图像中每个像素属于上述模型的后验概率并将后验概率作为此像素的权重,最后结合WS模型来估计图像最低位变化率。实验结果表明,该算法能有效地并且准确的估计图像最低位变化率,并且有较好的效果。  相似文献   

3.
朱雪梅 《科技信息》2011,(6):259-259
四音格是指结构上固定(包括可拆分和不可拆分两类),意义上是一个整体,或并列,或偏正,或补充的一种语法格式。四音格词指的是意义上只表达一个整体概念,结构上凝固且不可拆分的四音格,其功能完全等同于一个词。我们所说的四音格词只是四音格中作为词使用的一种特殊类型。四音格词与四音节词在结构上也有区别。前人对四音格结构的研究不是很多,尤其是长期未意识到四音格里存在四音格词。本文提出细分四音格的各种形式,并重点鉴别和描写汉语的四音格词。  相似文献   

4.
基于最大后验概率的帧同步判决   总被引:4,自引:1,他引:3  
针对高误码率、高滑码率的恶劣无线数字传输链路,为了提高帧同步判决的可靠度并从而提高系统传输效率,该文提出了一种基于最大后验概率(MAP)的定长帧同步判决算法.该算法能够根据信道实时反馈的误码率和滑码率,并利用特定应用中滑码长度的先验概率特性以及前后帧的相关性进行帧同步判决.这种算法相比传统的帧同步搜索性能有明显的改善,在误码率为5 × 10-2且滑码率为1 ×10-8时,误同步率仍然低于5×10-5.该同步算法还具有可扩展性,可以方便地扩展到变长帧的同步判决、变长包的解复接等多种应用场合.  相似文献   

5.
介绍了Bayes网络学习的Bayes方法,给出了Bayes网络学习的后验概率准则,并依据准则采用B-搜索算法和MCMC搜素算法寻找好的网络模型。  相似文献   

6.
基于后验概率的住房信贷评估SVM模型   总被引:1,自引:0,他引:1  
针对标准SVM模型在信贷评估中单纯将客户划分为违约或者未违约的不足,提出了利用基于后验概率的SVM用于住房信贷评估的方法.利用商业银行的住房信贷数据进行的实证研究表明,基于后验概率的SVM模型通过将标准SVM的决策值转化为后验概率输出,能够对住房信贷客户的违约概率进行估计,对于商业银行根据客户的违约概率制定相应的信贷政策以及设计相应的住房信贷产品更具有实践意义.  相似文献   

7.
基于音素相关后验概率变换的发音质量评价   总被引:1,自引:0,他引:1  
帧规整对数后验概率是目前公认最有效的发音质量的度量。但该文证明了该度量还反映了当前发音对应的声学模型与概率空间中声学模型的混淆程度,使其在评分任务上存在着严重的缺陷。因此,该文提出了可训练的音素相关的后验概率变换;并研究了线性和非线性sigmoid变换,同时给出线性变换的显式全局最优解和非线性变换的梯度下降解法。在全国采集的普通话水平测试现场考试的篇章朗读题型上进行实验。实验结果表明:当概率空间包含所有音素时,该方法能使人机相关度从0.582提升至0.768;当采用优化的概率空间时,该方法能使人机相关度从0.696提升至0.773。  相似文献   

8.
在无人车交通标志识别系统中,以传统的神经网络算法或标准的支持向量机算法(SVM)设计的分类器,只能反映样本是否属于某类而不能确定样本属于某类的可信度,提出一种后验概率SVM交通标志识别方法。首先对检测与跟踪得到的交通标志大概区域图像进行彩色分割以精确定位交通标志区域,然后采用最大类间方差法分割交通标志的内部图案,最后将分割的结果进行大小归一化作为交通标志的特征图像以训练分类器和进行识别。实验结果表明,基于后验概率SVM的交通标志识别系统在复杂的室外环境下具有很强的鲁棒性和可行性。  相似文献   

9.
针对旋转干涉仪测向定位系统存在相位模糊的问题,提出了一种基于最大后验概率的单站无源定位算法。该算法以旋转长基线干涉仪输出的模糊相位差为基本定位信息,无需解模糊即可实现对辐射源的精确定位。仿真计算表明该算法具有定位精度高、速度快的优点;并分析了影响定位精度的因素,计算了算法定位误差的几何分布,结论表明通过增加基线长度、提高基线波长比能较大提高定位性能,并且定位性能与目标和定位站的距离有关。  相似文献   

10.
基于环境特征的语音识别置信度研究   总被引:2,自引:0,他引:2  
传统的语音识别置信度方法基于各种静态特征进行分类判决,而忽略了词与周围环境之间的关系所携带的信息。为了进一步提高置信度特征的分类性能,该文提出了上下文环境、动态环境、句全局环境共3类5种环境特征,从空间与时间角度较全面地描述了词与环境之间的关系。实验结果表明:静态特征与环境特征联合分类的性能与只用静态特征相比有不同程度的提高,其中,静态环境与环境特征的二元联合最高有5.02%的相对改进,三元联合最高有6.11%的相对改进,说明环境特征确实是一种有价值的置信度特征,并且这几类环境特征之间存在一定的独立性。  相似文献   

11.
针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分,比较前后两次算出的分数从而选出更可靠的识别结果。实验表明,通过该方法将段长模型应用在识别过程中,可以显著提高识别系统的性能,大量减少识别结果中的插入错误。数据显示,该方法使识别系统的音节错误率下降了大约10%,识别系统最终的插入错误和删除错误都低于1%。  相似文献   

12.
基于多尺度分形维数的汉语语音声韵切分   总被引:10,自引:0,他引:10  
针对低信噪比环境 ,提出一种汉语语音声韵母切分新方法。以语音信号非线性产生机制中存在混沌特性为依据 ,将普通分形维数扩展为多尺度分形维数 ,用于考察语音信号在不同最大观测分辨率下的局部自相似性。利用稳定声韵母段及其之间过渡段在多尺度分形维数上的不同特性能较好地区分二者。由此针对汉语音节“声母 +韵母”的结构特点设计了一种简单而高效的汉语语音声韵母切分方法。在干净语音测试集下测试 ,切分正确率为 95 .2 % ;在信噪比为10 d B的噪声环境下 ,正确率达到 82 .3%。  相似文献   

13.
介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统。在双语混合语音识别中,主要面临的2个问题:①在保证双语识别率的前提下控制系统的复杂度;②有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法(TCM),并将该方法与基于声学似然度准则的聚类方法进行了比较。实验结果表明:利用TCM进行音素聚类的识别性能优于基于声学似然度音素聚类的性能,最终得到的中英双语识别系统在纯英文测试集上的短语错误率(PER)相对基线单英文识别系统下降7.19%;在双语混合测试集上PER相对基线混合模型下降13.78%;同时在纯中文测试集上保持了基线单中文识别系统的性能。  相似文献   

14.
汉语口语对话中姿态与语音信息关系初探   总被引:1,自引:0,他引:1  
信息交互方式多种多样,以语音和姿态的表达最为自然,因此提高人机交互能力就需了解交际过程中的这2种模态对信息表达之间的关系.该文介绍了语音与姿态关系的相关理论和产生模型,并以电视访谈节目中自然对话的视频和音频数据为研究对象,对汉语普通话语音和姿态信息在交际过程中的关系进行了初步的研究.在语音学和姿态标注的基础上,分析了口语对话中焦点重音与姿态动作之闻的关系,以及韵律边界和姿态边界之间的关系.研究发现语音上重音表达往往伴随较强烈的手部动作,而且此时手和头部动作之间有互补的现象;韵律边界和姿态边界没有时间上的对应关系,但有很大的相关性,这些结果都支持语音与姿态表达之间的关联理论.  相似文献   

15.
韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要难点。在已有的研究工作中重音的定性分析较多,但重音生成则相对较少。该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(hid-den Markov model,HMM)语音合成系统。在文本分析模块引入最大熵模型完成了基于文本特征的重音预测,然后根据重音调整韵律参数得到调整后的HMM模型,最后采用基于隐Markov模型的语音合成技术(hidden Markov modelbased speech synthesis,HTS)系统合成语音。实验结果表明:采用该方法能够合成出抑扬顿挫的语音。该方法的优势在于能够灵活地扩展到对其他语音表现力的合成。  相似文献   

16.
由于汉语是声调语言,在连续语流中韵律词重音不仅会受到其所在韵律层级的影响,也会受到调型组合的影响。该文在大规模连续普通话语音数据库的基础上,从韵律层级和调型组合2方面对韵律词重音感知作了细致分析。实验结果表明,在不同韵律层级和调型组合条件下,重音感知呈现出规律性差异,主要表现为:1)随着韵律层级的上升,时长和基频都随着重音级别的增大而增大,但基频对重音感知的影响更大;2)在相斥的调型组合下,时长对重音感知的作用要显著高于其在相容调型组合下的作用;3)在连续语流中,双音节韵律词的重音模式没有显著稳定性。  相似文献   

17.
针对目前并行排序算法适用面窄、需要特殊硬件支持的问题,在进一步分析双调排序算法最优化解的基础上,提出了一种新的基于网格互连网络的处理器编号策略-对分编号策略,并求出了基于该策略的双调排序算法时间复杂的一般形式和最快情况,该策略适用于任意维度的通用网格互连处理器网络,且无需额外的硬件支持,调度实例,证明该策略下的双调排序算法具有无死锁调度的特性。  相似文献   

18.
XML既是互联网上流行的信息交换媒介,也是储存数据的主要方式.对大量XML数据做查询,要加快查询速度,最有效的方法之一就是建立良好的索引结构并辅以相关的搜寻技术.动态XML 数据标记法(LSDX)可以动态更新标记,不用重建索引和标记,由于有2个问题仍然没有完全解决,因而影响它的实用性,提出的2个标记编码规则很好地解决了这2个问题.  相似文献   

19.
Improved Grapheme-to-Phoneme Conversion for Mandarin TTS   总被引:1,自引:0,他引:1  
Several methods were developed to improve grapheme-to-phoneme (G2P) conversion models for Chinese text-to-speech (TTS) systems. The critical problem of data sparsity was handled by combining approaches. First, a text-selection method was designed to cover as many G2P text corpus contexts as possible. Then, various data-driven modeling methods were used with comparisons to select the best method for each polyphonic word. Finally, independent models were used for some neutral tone words in addition to the normal G2P models to achieve more compact and flexible G2P models. Tests show that these methods reduce the relative errors by 50% for both normal polyphonic words and Chinese neutral tones.  相似文献   

20.
西藏植物资源检索系统   总被引:3,自引:0,他引:3  
本介绍了西藏植物资源检索系统的建库意义,开发过程,使用环境,系统功能,使用方法和发展方向。本系统可以快速简捷地查询西藏境内所有植物类群种名,拉丁名、科名、属名。并显示植物类群的形态特征,特征图谱,地理分布,生长环境和经济用途。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号