首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 140 毫秒
1.
目前的技术不能使单字识别系统的识别率达到100%,单字识别系统会产生错判和拒判。因此,将满文中单词识别系统的识别信息和满文的词组信息有机的结合起来,建立满文词组和待定词集统计信息库,采用基于统计的隐马尔可夫模型的方法,利用Viterbi动态规划法求最佳路径,对满文的单字识别输出进行后处理,可以有效的提高识别系统的识别率。实验表明,单字识别系统的识别率越高,后处理的纠错能力越强。  相似文献   

2.
将满文单词识别系统的识别信息和满文的词组信息有机地结合起来,建立满文词组和待定词集统计信息库,利用贝叶斯准则,综合满文待定词的后验概率和词组的先验概率信息,建立合理有效便于实现的数据结构,对满文单词识别系统输出存在的拒识词和错识词进行检测和纠正,从而有效地提高满文识别系统的识别率·实验表明:后处理性能除取决于语言模型外,还取决于后概率的精确估计·另外,在单词识别系统识别率高的情况下,后处理的纠错能力会增强·  相似文献   

3.
一种基于噪声信道模型的汉字识别后处理新方法   总被引:3,自引:0,他引:3  
利用上下文关系进行汉字识别后处理时 ,若候选字集中不含有正确字符 ,文本识别率的提高会受到很大限制。基于单字识别系统的噪声信道模型 ,文中提出一种扩充候选字集的方法 ,利用单字识别给出的候选字来推测可能正确的字 ,并将它们与识别候选字进行集成 ,得到新的候选字集。30 0套脱机手写体样本的测试表明 ,新候选字集的 5 0选平均错误率较原先的识别候选字集下降了 37.88%。脱机手写体文本 (约 8万字 )识别后处理中 ,语言模型为基于字的bigram时 ,文本平均识别率从扩充候选字之前的 93.93%提高至 95 .82 % ,错误率下降了 31.14%。  相似文献   

4.
提出了一种图像背景下的满文文字提取方法。用数字图像处理的方法对含有图像背景的满文图片进行单字提取,并进行去噪、细化、剪枝等预处理,找到这个单字的主轴,终止点、内部点和交叉点,在主轴上找到临界点,由临界点进行笔画生长从而达到满文文字笔画提取的目的。为了验证方法的可行性,对手写体满文图像、印刷体满文图像和彩色图像中的满文分别进行了文字提取。实验结果表明该方法对满文文字提取率较高,为进一步研究满文的识别奠定了坚实的基础。  相似文献   

5.
提出了一种图像背景下的满文文字提取方法。用数字图像处理的方法对含有图像背景的满文图片进行单字提取,并进行去噪、细化、剪枝等预处理,找到这个单字的主轴,终止点、内部点和交叉点,在主轴上找到临界点,由临界点进行笔画生长从而达到满文文字笔画提取的目的。为了验证方法的可行性,对手写体满文图像、印刷体满文图像和彩色图像中的满文分别进行了文字提取。实验结果表明该方法对满文文字提取率较高,为进一步研究满文的识别奠定了坚实的基础。  相似文献   

6.
基于复合特征的P2P业务识别系统的研究与实现   总被引:1,自引:0,他引:1  
着重分析了P2P流量统计特征,根据不同应用的流量模式和实验结果,提出了一种基于流统计特征的P2P识别方法.这种方法不需要对数据报文载荷信息进行检查,因此不受数据是否加密的限制,扩大了P2P识别的范围.论文将基于流统计特征的识别方法与端口法、有效载荷特征串识别法等结合起来,构成复合的P2P流量识别系统.实验数据证明,该系统不仅能识别出更多的P2P应用,而且还具有较高的识别率和较低的误报率和漏报率,应用到实际网络中效果良好.  相似文献   

7.
设计了一种电视背景环境下的非特定人语音控制命令识别系统,包括基于隐马尔可夫模型的孤立词识别子系统和基于扩展信息最大化(Infomax)独立成分分析算法的语音分离子系统.本语音识别系统的语音库包括8 400个电视机转台控制命令的语音数据.在无噪环境下对特定语音命令的识别率可达93.2%,正常电视背景环境下的识别率降至49.0%,对电视背景下通过分离后的语音命令识别率可达85.8%.  相似文献   

8.
研究了汉语大词汇词组语音识别算法的实现问题,提出了适用于大词汇汉语语音识别的有效而可行的训练和识别策略,对其中一些关键问题做了比较性实验,得出了一些有益的结论.针对汉语语音学特点提出了一种新的识别基元依赖韵头的声韵母模型(FHIF),实验证明FHIF的确优于普通的声韵母模型(IF).随后介绍了一个特定人汉语大词汇词组语音的模拟识别系统,该系统原则上可以识别无限的汉语词组,通过对汉语中最常用的5000词的测试结果表明,该模拟系统首选词条在特定人下已达到了约87%的识别率  相似文献   

9.
对车牌识别系统的组成进行简要的介绍,并以BP网络为例介绍了人工神经网络在车牌识别系统中的应用,提出了对于特定场所的识别系统可以通过简化网络,提高识别率和识别速度.  相似文献   

10.
为给满文识别系统提供基元特征和训练测试样本,在对图象进行灰度化、二值化、倾斜校正、行列分割等预处理后,构建了印刷体满文文字多级数据库,包括列文本库、单词库和基元库3个子库。该库的构建为后续满文识别提供了技术支撑。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号