首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
基于数据库技术的汉字处理方法研究   总被引:1,自引:0,他引:1  
汉字的点画结构使其在信息化处理中面临许多困难.本文从汉字的字型结构出发,研究数据库技术在汉字处理中的应用,提出将汉字拆分成部件,将汉字部件、汉字结构类型和部件拼接变形算法等基本数据用数据库进行管理,作为各种汉字处理应用的基础数据平台的思路和方法.在此平台之上,可以实现汉字字库生成等功能,为减小汉字图像存储量,实现风格多样的电脑汉字艺术等提供帮助.  相似文献   

2.
介绍了一种按照TrueType字库格式对手写汉字提取字形轮廓的算法,包括手写汉字轮廓数据的获取、轮廓的有序化以及轮廓字形特征点的提取等主要步骤.实验表明,该算法效果良好,提取出的字形轮廓可以写入Windows集外字TrueType字库,自动生成TrueType字模.  相似文献   

3.
为了实现智能化汉字书写教学,提出一种手写汉字图像的笔画还原方法。首先提取手写汉字图像的骨架;然后从知识工程的角度出发,利用字形中稳定的拓扑信息,消除骨架中的歧义变形;最后利用A*算法建立并求解手写汉字与相应模板汉字的字形相似度模型,从而分割出手写汉字图像中的各个笔画,并输出它们与模板汉字中各个笔画的对应关系。此方法的笔画还原结果可以应用于手写汉字规范性的自动化评判等场合。  相似文献   

4.
基于笔划的手写体汉字方向分解特征提取方法   总被引:5,自引:1,他引:5  
提出了一种基于笔划的手写体汉字方向分解特征提取的新方法。根据每个笔划像素点及其邻域像素点的方向分布特征,汉字图像被分解为“横”、“竖”、“撇”和“捺”4种子模式,而无需提取轮廓和骨架。文中构造了5种不同的弹性网络,并将其应用于方向分解特征的提取,最后,应用863手写样本库HCL2000验证了本文方法的有效性。  相似文献   

5.
提出一种基于文字结构特征的神经网络手写汉字识别策略 ,根据所提取的文字笔画方向、基本轮廓和交叉点等特征 ,采用基于自组织神经网络的模式聚类该方法完成正规手写文字的识别 .该方法提取的笔画轮廓十分准确有效 ,对手写汉字的约束少 ,可识别的汉字数量大 ,在仿真实验中有效地识别了绝大多数手写汉字  相似文献   

6.
基于笔画分析和背景细化的粘连手写汉字切分   总被引:5,自引:0,他引:5  
离线手写汉字的切分是识别的前提,其中粘连手写汉字的切分最为困难。提出一种基于笔画分析和背景细化的粘连手写汉字的切分新方法。对粘连字符图像作细化处理,检测端点、叉点和角点等特征点,根据特征点提取笔段。按笔段的长度、相互之间的位置关系以及投影信息确定切分点。细化粘连字符的背景图像,从切分点出发在细化的背景中选取分割路径,实现粘连手写汉字的切分。实验表明,本方法对于粘连手写汉字具有令人满意的切分效果。  相似文献   

7.
基于地址结构匹配的手写中文地址的切分与识别   总被引:2,自引:0,他引:2  
为了自动识别手写中文地址,提出基于地址结构的汉字字符切分和匹配方法。它将地址行图像过切分为一列子字符图像,对于可能的子字符合并方式进行识别。置信度比较大的词作为关键词搜索地址数据库,得到一系列候选地址。对每个候选地址进行匹配,综合考虑切分、识别和匹配代价给出最终结果。该方法在565个地址行样本上获得了超过91%的地址匹配率。实验表明:该方法能有效地克服传统手写汉字切分方法的不足,减少切分错误,从而提高地址匹配的正确率。  相似文献   

8.
针对中文字库制作开销过大的问题, 提出一种基于部件拼接的高质量中文字库制作方法。参考汉字相关规则与信息, 选取供用户书写的少量汉字集合, 将书写的汉字分割至部件级别。根据汉字部件成字关系, 拼接产生剩余汉字, 最终生成完整GB2312标准(共包含6763个中文字符)的高质量中文字库。实验表明, 所提出的字库制作系统实现了快速生成个性化中文字库的功能, 在保证生成字库质量的前提下, 显著降低了个性化中文字库的制作时间。  相似文献   

9.
现有计算机在指导手写汉字练习与测试中,指导依据大都基于全局特征,缺少基于更细粒度特征。提出一种基于局部信息的手写汉字笔画提取方法,为手写汉字评价与指导等任务提供数据支持。首先提取出汉字骨架并对骨架中的毛刺与断裂等问题进行优化;然后使用PBOD算法提取汉字交叉区域后,对交叉区域进行合并删除,消除笔画形变,通过局部信息计算笔画段的组合系数,根据组合系数提取笔画;最后根据获取到的笔画数与算法迭代次数,动态调整组合系数阈值,保证在正确连接笔画段的前提下提取到更可能多的笔画。将该方法在手写汉字数据集上进行实验,其准确率、召回率与F1值分别达到了95.91%、95.71%与95.81%,可用于后续的手写汉字评判与指导等任务。  相似文献   

10.
汉字笔画若干数据的统计方法研究与应用   总被引:5,自引:0,他引:5  
统计汉字笔画信息的各种数据,这些数据主要包括:每个汉字的平均笔画数及按使用频度加权的平均笔画数、以各种笔画起笔的汉字数目、各种笔画在汉字字库中的出现次数、汉字字库中笔画相同的汉字、能与其他字区分开的汉字前若干笔画数的平均数与加权平均数以及汉字字库中相邻笔画的频度等。统计的数据对于基于笔画的汉字输入法和汉字的联机手写识别等方面具有重要的指导意义,我们根据这些统计资料设计了标准键盘和数字键盘,并在Windows下实现了以上两种笔画输入法。  相似文献   

11.
设计并构建了一种记录书写者民族信息的手写体汉字数据库———大连民族学院DNU-Ⅰ型多民族脱机手写体汉字数据库。包括单字库、行文本库和段文本库3个子库。为少数民族汉字书写特征分析、中文文档的行切分、汉字的切分识别、中文文本的无切分识别、笔迹鉴别和签名验证等方面的研究奠定基础,并提供算法的验证平台。同时介绍了字符识别数据库的一般构建流程和数据库图像二值化、归一化、行分割等预处理算法,为少数民族文字数据库的构建提供了技术支撑。  相似文献   

12.
介绍了手写体汉字特征提取的基本概念,采用了一种叠合网络加权笔画提取方法用于提取有限集汉字特征。通过对径向基函数网络(RBF网络)的模型分析,提出了一种组合RBF网络分类器应用于有限集手写体汉字识别,并利用结合遗传算法和模拟退火算法的混合优化策略进行RBF分类器的训练。  相似文献   

13.
为了实现少数民族文字手写体样本的快速采集,为少数民族文字数据库的建设奠定技术基础,提出一种改进的图像二值化方法和一种基于可接受度的灰面积关联度对比方法;并建设了满文字母模板库和读音数据库,以MATLAB GUI为平台开发了一种少数民族文字手写体采集系统。  相似文献   

14.
对于"廷"字的使用,国人都习以为常,殊不知它是不规范的,而规范的写法应是"廷"。1997年《现代汉语通用字笔顺规范》将"廷"的字形改为"廷",含"廷"的一组字形也都随之改形。该组字的新旧字形并存了十四年之久,造成了较为严重的混乱,至今尚未得到有效的解决。2009年《通用规范汉字表》征求意见稿又拟改回"廷"组字形。"廷"字混乱,挑战国家语委之权威;"廷"字复原,拷问国家法律之尊严。教育部、国家语委应果断采取措施为"廷"组字正名,使汉字规范更好地适应现代社会信息技术高度发展的要求。  相似文献   

15.
中西文化冲突与交融下的"孝"是华裔美国文学中一个常见的主题。它与众多华裔美国人的"美国梦"有着颇深的文化联系。小说《向我来》通过主人公杰克与女儿维达、"契纸母亲"伊琳与维达之间的关系和故事,集中体现了华裔美国人的"孝文化"与"美国梦"之间的妥协与超越。这对于华裔美国人准确地进行文化身份认同提供了很好的借鉴。  相似文献   

16.
本文提出了组合式汉字库的构想,讨论了该数据库的层次模型和系统组成,阐明了笔划、字元索引库、汉字索引库的关系,以及数据结构和实现方法,最后指出了该汉字库与现有汉字库比较的优点和需要进一步探讨的问题。  相似文献   

17.
吴琴霞 《科学技术与工程》2013,13(15):4426-4432
目前汉字字形的生成仍是手工劳动和人工设计,加上汉字数据量巨大截止到现在没有一种合适的字形自动化生成工具可以使用。针对这一难题提出了一种基于字形描述库的汉字字形自动生成的技术。该技术先将汉字字形与字形描述库映射,以字形描述库为桥梁将汉字字形数据化,然后通过查找字形描述库找到汉字对应的骨架信息,提取笔画骨架。最后通过数据的逆向处理将笔画骨架信息还原为各种汉字字形,形成汉字字形库。  相似文献   

18.
提出一种改进手写字体特征的提取方法:将传统的PCA特征方法与13点特征方法进行综合,得到一种PCA+4点的特征提取算法,然后通过BP神经网络进行训练识别.实验仿真表明这种改进的方法比PCA特征提取及13点特征提取的识别率高,特别在手写变化大、手写速度快等方面优势更加明显.  相似文献   

19.
基于融合特征和LS-SVM的脱机手写体汉字识别   总被引:3,自引:0,他引:3  
提出的脱机手写体汉字识别系统主要研究特征提取和分类识别两个模块.特征提取模块主要包括采用基于不变矩和弹性网格技术的串行特征融合方法,所得到的特征向量不仅充分反映了手写体汉字的全局和局部特征,而且具有很强的区分表达能力.分类识别模块将神经网络多类分类策略与最小二乘支持向量机相结合,所得到的分类器不仅识别率高、泛化能力强,而且有效地解决了多类分类问题.实验证明本文提出的识别系统能够取得很好的识别效果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号