首页 | 本学科首页   官方微博 | 高级检索  
     

汉字识别中图特征提取方法
作者姓名:唐善成  梁少君  戴风华  来坤  曹瑶倩
作者单位:1.西安科技大学通信与信息工程学院, 西安 710054;2.中交第二公路工程局有限公司, 西安 710065
基金项目:国家重点研发计划项目(2018YFC0808300);陕西省科技计划重点产业创新链(群)项目(2020ZDLGY15-07);西安市科技计划科技创新引导项目(201805036YD14CG20(4))
摘    要:为解决图像像素表示汉字特征方法不能有效表示汉字本质特征、空间复杂度较高的问题,提出了一种汉字图特征提取方法.方法主要包含汉字图像二值化,汉字图像骨架提取,汉字图特征提取 3 个部分;二值化消除图像中的噪声,提高图特征提取的准确度;骨架提取保留图像中重要的像素点,剔除无关的像素点;图特征提取将汉字关键点与图数据结构结合来表示汉字形状特征.在3 908 个常用汉字的5 种字体上进行实验.结果表明,该方法能够正确提取笔画复杂汉字的图特征,有效表示汉字本质特征;不同字体汉字图特征相同的汉字数量最高为3 195 个,方法表现较稳定;平均每个汉字可以用 22.6 个图节点、19.1 个边表示,相较于用单通道图像表示汉字特征,可大幅降低空间复杂度.

关 键 词:汉字识别  图特征  图数据结构
收稿时间:2023-01-12
修稿时间:2023-10-08
本文献已被 万方数据 等数据库收录!
点击此处可从《科学技术与工程》浏览原始摘要信息
点击此处可从《科学技术与工程》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号