首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
印刷体蒙古文字识别中蒙古文字特征的选择   总被引:2,自引:0,他引:2  
从文字识别的角度出发,依据印刷体蒙古文字的特点,选择笔划轮廓结构特征、笔划穿越特征、关键特征点、蒙古文构词法等作为蒙古文字的特征,并以这些特征来设计分类器.该分类器已经被成功地用于印刷体蒙古文字识别软件中,取得了较高的识别率,从而证明了选取这些特征是合理的、有效的.  相似文献   

2.
实用高效的蒙古文词切分方法是实现蒙古文信息处理的前提和基础.研究提出从3种基本的蒙古文词切分方法,组合成12种蒙古文词切分方法.应用数据包络分析(DEA)方法,提出用于蒙古文词切分方法综合评价的数学模型和有效性计量公式,并围绕蒙古文切词方法的智能选择问题,提出基于国际标准编码的蒙古文词切分系统的设计方法和整体框架.  相似文献   

3.
一种基于字符轮廓特征的印刷体汉字切分方法   总被引:1,自引:0,他引:1  
针对单一汉字切分方法的不足,提出一种基于字符轮廓凹凸特征的印刷体汉字切分方法,首先对扫描后的印刷体汉字文本图像进行二值化处理,根据整篇汉字字符的左右轮廓凹凸特征,把字符图像切成一个个的汉字行,最后根据每一个汉字行的字符串上下轮廓凹凸特征,把每一个汉字行切分为单独的汉字字符.仿真实验表明,提出的方法对于标准的纯印刷体汉字文本图像,可以得到比较理想的切分效果.  相似文献   

4.
针对印刷体维文在连体段切分部分存在过切分和漏切分的现象,结合水平投影法和连通域搜索法实现维文文本的行切分和单词切分;同时针对连体段切分正确率不高的问题,提出一种新的切分方法。首先对字母连体段位于基线上方的部分进行竖直投影来寻找所有可能的切点,然后利用阈值判定法去除误切分。实验证明,该方法提高了印刷体维文的切分正确率,为提高维文识别的正确率打下基础。  相似文献   

5.
在字符识别技术日趋成熟的现状下,单个字符的正确切分及提取已经成为制约字符识别精确度的关键因素。本文针对二手车发票上印刷体的日期数字(阿拉伯数字),对图像二值化处理后,采用垂直方向投影和轮廓特征两种策略进行自适应字符切分及提取。实验结果表明,该方法提高了从图像中定位出来的字符串的切分率,并保证了字符切分和提取的正确率平均达到99%。  相似文献   

6.
印刷体数学公式中存在粘连字符是限制公式识别系统性能提升的主要因素之一。因此提出一种针对公式粘连中字符水平粘连和角标粘连的切分算法。该算法首先以滴水法为指导思想寻找峰和谷,然后根据峰和谷的形态特征、位置关系及对应位置的垂直投影等特点选出候选切分点,最后根据切分点附近的笔画信息确定切分路径。实验结果表明,该方法能够很好的适用于公式中水平和角标的粘连字符的切分。  相似文献   

7.
印刷体蒙古文字识别技术中切分方法的设计与实现   总被引:1,自引:2,他引:1  
文字识别是人工智能的一个重要研究领域.有些民族文字识别的成果已转化为商品化软件.蒙文文字识别的研究还处于起步阶段,蒙古文字的结构和书写方式与其他文种相比有许多特点.印刷体蒙文文字识别技术中字元切分的方法,经过实验其切分正确率在98%以上,并已成功地用于印刷体蒙文识别软件中.  相似文献   

8.
Skip-N蒙古文统计语言模型   总被引:1,自引:0,他引:1  
蒙古文具有典型的构词词缀的特点,一个词往往可以切分成词干和词缀等若干个部分.如果采用通常的N-gram语言模型很难描述词干、词缀等的长距离依赖关系.提出了一种利用长距离依赖的Skip-N语言模型,给出了相隔N个词的二元依赖关系.对这种方法进行了实现,并在一个基于实例的汉蒙机器翻译系统上进行了实验,实验证明Skip-N语言模型能够有效地提高汉蒙机器翻译的效果.  相似文献   

9.
本论述采用藏语三级切分体系对藏文文本进行分词和词性标注,并借助手工建立的藏文情感分析用词表,与已有的特征选择方法相结合提取情感特征,用相似度分类算法进行藏文文本的情感分类,达到了较好的分类效果.  相似文献   

10.
本文提出了一种新的描述多种印刷体汉字的方法——特征链码法.使用该方法无需先对汉字图像进行细化和平滑处理,可以克服汉字图像位移、不同大小以及一些噪声的影响.实验中针对常用的一级字库约3700个仿宋体、宋体、黑体(理论上还可以扩充到二级字库6700多个印刷体汉字,字体还可以增加楷体等),以及相应的尺寸出现的变化如24×24、24×48、48×48等做了特征抽取和识别试验,实验中还对链码特征库进行了几种预分类.  相似文献   

11.
基于学习分类器(LCS)的MP3音乐分类方法   总被引:1,自引:0,他引:1  
面向MP3音乐的分类方法是利用MP3编解码的特点,将MP3音乐文件表示成特征向量,采用常用机器 学习分类方法对音乐文件进行分类。重点对MP3音乐特征片段提取和分类方法进行讨论,提出基于离散余弦变 换(MDCT)系数域3种特征参数的特征片段提取方法和基于LCS(学习分类器)的音乐分类方法。实验表明,特征 片段提取方法能够在最短时间内找到最具有“特征”的特征片段,从而缩小了匹配时间,因此LCS分类方法提高了 分类方法的命中率。  相似文献   

12.
提出了一种新的不完全树结构小波变换用于纹理特征提取,提出了一种与人类视觉过程相一致的多分辨率多通道纹理分析方法,它由(1)特征提取:使用不完全树结构小没变换抽取纹理特征;(2)基于模糊Kohonen聚类网络的特征粗分类:使用缩减的特征向量对网络进行训练,得到粗分割结果;(3)粗分割结果的细化等几部分构成。实验结果证明了本方法的有效性。  相似文献   

13.
目前面向对象的分类研究中,对于研究区影像的分割尺度问题多以试验者的多次试验以及主观推断为主,缺乏定量化的评价标准。同时,在对遥感影像分类的算法选择以及在分类过程中,有效特征空间的选取均存在一定程度的主观性。针对遥感影像面向对象分类过程中分割尺度选择盲目及分类空间构造主观性较强的问题,以World View-2遥感影像数据为例,首先利用改进的全局最优分割尺度的方法获取研究区影像的最优分割尺度,在此基础上选取了研究区分割对象的48个特征,利用OOB误分率对各个特征的重要性排序;然后按重要性顺序以5为步长讨论特征数量对分类精度的影响,构建了用于分类的最优特征空间;最后将采用最优特征空间的随机森林算法获得的最佳分类结果,与面向对象的最邻近像元、决策树以及支持向量机分类算法进行了比较。结果表明,用于分类的特征数量与分类精度之间,并不是简单的正相关关系;与面向对象的最邻近像元、决策树以及支持向量机分类算法相比,利用最优特征空间进行随机森林分类的分类精度最高,表明该方法更适合于高分辨率World View-2数据的分类。  相似文献   

14.
医学图像分割是临床诊断的关键环节,分割结果将直接关系到后续对病灶的识别。C-V模型(Chan-Vese)大量应用于各种医学图像分割过程。围绕肝脏超声图像,针对传统C-V模型依赖初始轮廓及运算复杂耗时的特点,融合随机森林方法,提出一种基于边缘引导能量函数和局部约束特征的分割方法,利用随机森林节点生长和分类速度快的优势,在粗分割的基础上形成无需初始化的C-V模型,而后借助分类特征得到精准的肝脏区域及病灶分割结果。实验证明,经过优化的改进方法是可行有效的,对于图像中的组织和病灶区域能有效分割和提取  相似文献   

15.
从图像中提取多种特征向量堆叠为一个高维特征向量用于图像语义分割,会导致部分特征向量的分类能力减弱或丢失。针对此问题,提出了一种结合深度卷积神经网络AlexNet和条件随机场的图像语义分割方法。利用预训练好的AlexNet模型提取图像特征,再通过条件随机场对多特征及上下文信息的有效利用来实现图像的语义分割。与利用传统经典特征的方法进行对比,实验结果表明:在利用AlexNet模型提取特征进行图像语义分割时,Conv5层为最有效的特征提取层,在Stanford background和Weizmann horse数据集下的识别准确率分别为81.0%和91.7%,均高于其他2种对比方法,说明AlexNet可以提取更有效的特征,得到更高的语义分割精度。  相似文献   

16.
一种不需分词的中文文本分类方法   总被引:2,自引:1,他引:1  
提出了一种不需分词的n元语法文本分类方法.与传统文本分类模型相比,该方法在字的级别上利用了n元语法模型,文本分类时无需进行分词,并且避免了可能造成有用信息丢失的特征选择过程.由于字的数量远小于词的数量,所以该分类方法与其它在词级别上的分类方法相比,有效地降低了数据稀疏带来的影响.系统地研究了模型中的关键因素以及它们对分类结果的影响.使用中文TREC提供的数据进行实验,结果表明,综合评价指标Fβ=1达到86.8%.  相似文献   

17.
针对深海三类典型的纹理:热液、岩石和海水,提出了一种新的基于增量特征和局部奇异性的水下图像分割方法.定义了一种新的增量特征s(d),反映像素点由小尺度到大尺度变化的剧烈程度;利用二维小波变换分析图像局部奇异性,并结合多项式拟合的方法提取奇异性特征P;最后根据s(d)和P组成特征矢量,结合k均值聚类方法,对图像进行分割.实验结果表明该方法能有效地分割出上述三类纹理.  相似文献   

18.
基于不规则区域分割及灰度排序分类的分形压缩算法   总被引:1,自引:0,他引:1  
基本分形压缩分类算法多以单一特征分类且需要庞大的匹配搜索运算。首次将PCNN分割引入分形压缩,提出一种基于不规则区域分割及图像灰度排序分类的分形压缩算法。算法首先对原图像进行不规则区域分割,然后利用所得二值图像的灰度值与原图像的灰度值两个特征对图像块进行联合分类,以缩小搜索匹配的范围,提高压缩速度。实验结果表明,所提算法在保证解码质量的前提下,大幅度减少了编码时间。  相似文献   

19.
心音信号可以反映人体心脏瓣膜活动情况,对心音进行分类可以区别出不同心音的病理性信息,这对于临床上诊断不同的心脏疾病具有重要的意义.心音分段是进行心音分类的前提,通过心音分段可以定位出心音中的第一心音(S1)和第二心音(S2),为心音特征参数提取与心音分类提供定位基准.为此,本文提出了一种新的自适应阈值选取心音分段算法.该方法首先利用小波变换默认阈值法对心音信号进行去噪;然后使用归一化香农能量来提取较为平滑的心音包络;接着对包络进行有效地峰值检测,从而确定初始大阈值TH1,并通过迭代法得到最终稳定的双阈值;最后进行心音分段以及分段结果分析.针对部分异常心音分段结果,如心音分裂等的分段结果,利用心音时域、能量等特性实现心音段的合并或去除,保证了分段结果的准确性.实验结果表明,本文方法对正常及异常心音分段准确率分别为97.24%和91.83%,总体分段准确率为95.56%,分段准确率高于传统的阈值选取分段方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号