首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 796 毫秒
1.
在分析传统手写汉字文本切分算法利弊的基础上 ,提出了一种改进的基于快速连通域提取的切分算法 ,算法具有很强的抗干扰能力 ,有效解决了小角度歪斜图像和笔画粘连字符的汉字切分问题 .同时给出了具体的实现方法  相似文献   

2.
提出了文本字切分要考虑的问题和字切分的基本思想,并给出了文本行字切分的实现算法.  相似文献   

3.
手写体信函地址汉字切分   总被引:3,自引:0,他引:3  
目前多数汉字识别系统仍基于单个汉字的逐个识别,因此对字符进行有效的切分,是离线汉字识别的一项重要工作,根据汉字手段写体的特点,在方差最小原理基础下,提出多步切分算法(粗分-细分-合并)和穿越算法,首先根据字段间间隔,用最小距离聚类的方法,得到5组粗分结果,从中选出最接近理想的一种,用改变类间距离和穿越算法,对较宽的字段进行细分,最后将过细的分割部件合并成一个完整的字,对现场采集的3000封信函进行切分,单字正确率可达90.8%。  相似文献   

4.
词组切分是现代中文信息处理的基础,是汉语自然语言理解与处理、机器翻译、智能检索、电子词典等信息处理的前提。分析了汉字输入训练中词组切分的特点,介绍了汉字输入训练中词组切分方法的具体设计以及切分词典的组织与检索上的一些方法和技巧。  相似文献   

5.
基于笔划合并的手写体信函地址汉字切分识别   总被引:6,自引:1,他引:6  
为了自动地处理存在着大量的笔划交叉与粘连的实际信函地址行,采用了一种基于笔划提取合并的手写体汉字切分识别方法.对于从实际信函中提取出的单行地址文本图像,首先提取出字符的横、竖、撇、捺等笔划,再根据一定的准则将笔划合并成字根,最终应用与地址解释相结合的动态规划算法得到最终的切分结果,获得投递区域.用从邮政分拣机上获得的443个信函地址行二值图像样本进行测试,省市一级和市县一级投递地址的正确识别率已经达到了66%.  相似文献   

6.
针对古籍文献版面图像切分中存在的过切分和粘连等问题,提出基于犹豫模糊集的古籍汉字图像切分方法。首先,对古籍汉字版面图像进行连通区域搜索,获取版面中的笔画部件,实现古籍汉字的初切分;然后,对过切分汉字进行特征分析,提取过切分区域的特征,利用犹豫模糊集在处理多属性决策问题方面的优势,通过建立犹豫模糊集来判断过切分区域归属同一古籍汉字的隶属度,并据此进行过切分区域的合并;最后,对存在粘连和重叠的汉字采用分段像素跳跃数突变分析方法进行分割。在28 886个古籍汉字上的实验结果显示,可以达到92. 3%的切分准确率和85. 7%的过切分合并准确率。  相似文献   

7.
基于笔画分析和背景细化的粘连手写汉字切分   总被引:5,自引:0,他引:5  
离线手写汉字的切分是识别的前提,其中粘连手写汉字的切分最为困难。提出一种基于笔画分析和背景细化的粘连手写汉字的切分新方法。对粘连字符图像作细化处理,检测端点、叉点和角点等特征点,根据特征点提取笔段。按笔段的长度、相互之间的位置关系以及投影信息确定切分点。细化粘连字符的背景图像,从切分点出发在细化的背景中选取分割路径,实现粘连手写汉字的切分。实验表明,本方法对于粘连手写汉字具有令人满意的切分效果。  相似文献   

8.
一种基于字符轮廓特征的印刷体汉字切分方法   总被引:1,自引:0,他引:1  
针对单一汉字切分方法的不足,提出一种基于字符轮廓凹凸特征的印刷体汉字切分方法,首先对扫描后的印刷体汉字文本图像进行二值化处理,根据整篇汉字字符的左右轮廓凹凸特征,把字符图像切成一个个的汉字行,最后根据每一个汉字行的字符串上下轮廓凹凸特征,把每一个汉字行切分为单独的汉字字符.仿真实验表明,提出的方法对于标准的纯印刷体汉字文本图像,可以得到比较理想的切分效果.  相似文献   

9.
基于笔划合并和动态规划的联机汉字切分算法   总被引:4,自引:0,他引:4  
联机手写汉字识别已从单字识别走向多字,乃至整篇文档的识别,字符的正确切分很大程度上决定了系统的性能.为了提高系统对整页文档的切分识别性能,该文提出了一种联机手写汉字的切分算法.通过基于规则的笔划合并将单个笔划合并成字符块,在此基础上,采用动态规划算法,利用字符块的长宽比、大小、间距以及识别信息,寻找出最优的切分路径.同时,对于手写汉字的任意性,提出了一种对汉字外接矩形框进行裁减的调整算法,使外接框并不包含整个汉字.实验证明,该文所提出的算法对于字数较多的多行样本以及存在字符相互粘连的情况,都有着很好的效果.  相似文献   

10.
在许多文字识别系统中,字符切分是预处理阶段的重要环节,其目的是从文本图像中分离出字母图像,然后针对切分后的每个字母进行识别。为了达到字符切分的目的首先要切分出文本图像中的每一个连体字母段。本文将彩色图像转换为灰度化的边缘图像,其次对图像进行局域二值化,再进行区域检测,初步实现了图像中维吾尔文字行的定位,然后根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段,对后面的字符切分打了很好的基础。实验结果表明,文字行的切分准确率达到92%,字切分准确率达到90%以上。  相似文献   

11.
提出了一种新的能对脱机无约束手写体中文文本行中的字符进行切分的方法.首先采用预切分算法产生一系列曲线候选切分路径;然后使用两个修正的二次判决分析函数对单字符的识别信息、文本行的几何信息进行融合,得到切分假设的置信度;最后利用动态规划算法搜索出最佳切分假设.使用哈尔滨工业大学多人手写真实文本数据库中的383个文本行对文中方法进行实验,在无语言模型的情况下,切分准确率可以达到89.70%,从而验证了所提字符切分方法的有效性.  相似文献   

12.
棒材切分轧制过程中三维弹塑性有限元模拟   总被引:1,自引:0,他引:1  
采用三维弹塑性有限元法对棒钢三线切分轧制过程的金属变形区进行了模拟。通过建立数学模型和计算,对切分轧件的变形特征、应力与应变进行了分析,提出了预切孔金属流动变形的稳定性问题。如果预切孔内轧件的变形过大,切分楔附近的金属网格发生了很大的扭曲畸变,造成变形不均匀和金属的流动不稳定。根据模拟分析的结果,设计了直径为Φ12mm带肋钢筋的三线切分孔型系统,轧制生产实验结果表明:采用优化的新切分孔型系统进行生产,提高了轧机的生产率,改善了产品质量。  相似文献   

13.
阐述了我国汉字传入日本的途径,以及汉字外形,含意,发音对日本文字形成的影响,并日前了日本人在长期的劳动生产实践中,利用汉字的草书,偏旁部首创造出平假名,片假名,并流传固定下来的过程。  相似文献   

14.
一般情况下,汉字的打印输出是在汉字操作系统下实现的,而有时为了实际需要,想在非汉字操作系统下进行汉字的打印输出,本文介绍了西文状态下汉字输出的原理及实现方法。  相似文献   

15.
本文介绍了在西文DOS下直接显示汉字的原理,给出了点阵汉字、美术汉字、工程汉字的显示方法  相似文献   

16.
介绍在MCAE中实现汉字功能的方法,软件汉化的发展概况及MCAE软件实现汉字编辑功能的必要性,并对汉字编辑技术,其中包括汉字字库的引入、汉字的输入方法、汉字在军库的查找、汉字的显示环境等进行了研究,该研究已成功地在Sun工作站上调试运行。  相似文献   

17.
针对传统汉字切分方法中对粘连汉字和重叠汉字切分不准确的问题,提出了基于极小阈值和曲线拟合的垂直投影汉字切分算法.该算法在传统垂直投影法汉字切分的基础上结合极小阈值和曲线拟合进行切分,实验结果表明:相对于传统汉字切分方法,该算法对含有粘连和重叠现象的手写体汉字文本的切分是有效的,从而可使手写体汉字的切分准确率有较大的提高.  相似文献   

18.
通过对汉字整体结构的分析及描述,在传统的特征点基础上,我们双提出了一种新的特征点,并对常用的特征点判别方法进行了改进。这种方法可以应用于印刷汉字及允许一定变形的手写体汉字,经实验表明,提取精度较高。  相似文献   

19.
提出用大规模并行网络的自然语言处理模型(即 MPNP 模型)处理中文的方法,它将中文的分词和语法分析合为一体加以统一的解决。以便实现多层次知识的综合。这种新的形式化方法吸收了当前连结主义模型的并行的优点,即用主动的节点—带局部记忆区和过程的节点和它们之间的连结关系显式地表达知识,用节点间的信息传送实现信息的并行处理。同时又保持了在较高层次模拟智能行为的特点。由于它的特殊的控制方法,它能够将自下而上的分析和信息传送与自上而下的期望扩散模型有机地结合起来。通过从左至右的扫描,并行地生成所有可能的分析,这一并行方法为新一代计算机的自然语言处理提供了一个有用模型。本文中从实现的角度较详细地阐述了这种处理方法的基本原理、结构和控制,以及中文分析系统的建造方法。  相似文献   

20.
介绍了广钢集团连轧生产线Ф14mm螺纹钢三切分轧制工艺的开发情况,并针对原工艺设备采取了多项措施,如改进料形,精心进行速度调整、严格切分箱装配及安装制度等.生产顺行后年效益在300万元以上.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号