期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

栗青生徐强肖建国刘泉张解放《北京大学学报(自然科学版)》2017,53(2)

提出一种基于汉字结构和风格的字形生成模型。该模型将汉字字形抽象为汉字结构和汉字风格两种模式,并在结构中将汉字笔画抽象为连续的笔元,通过笔元的特征点构造笔元向量、径向量、弦向量和轭向量,进行笔画风格的重建。通过这种方法,动态产生可用于True type个性化汉字字形设计的字形,实现汉字字形的Web存储和在客户端的特征字形输出,克服了现代汉字由于汉字数量巨大而在字形设计方面的不足,为个性化汉字信息的云端存储和云端字形服务提供了一种有效的策略和方法,为设计更深层次的汉字信息服务奠定了基础。相似文献

2.

基于特征加权的汉字点笔画生成研究

栗青生熊晶吴琴霞杨玉星《北京大学学报(自然科学版)》2014,50(1):153

针对汉字字形设计和开发的困难, 提出基于特征点抽象的汉字字形描述方法和汉字字形生成方法, 研究特征点、特征表达式、特征点的权值和权矢量等在汉字字形生成中的应用技术和方法, 并以点的生成为例, 设计汉字点笔画的生成算法, 并进行验证实验。实验结果证明该算法可靠并实用, 可切实提高汉字字形设计的效率, 为汉字其他笔画的生成提供一种解决方案。相似文献

3.

甲骨文字形动态描述库及其字形生成技术研究

栗青生吴琴霞杨玉星《北京大学学报(自然科学版)》2013,49(1):61-67

基于甲骨文字形多变, 异体字多等特点, 提出一种甲骨文字形描述方法, 将甲骨文字形进行矢量描述。建立了甲骨文字形描述库, 通过字形描述库自动生成多种甲骨文字形, 有效地解决了由于使用轮廓字形描述甲骨文字形而存在的字形动态编辑和字形变换的困难, 为古文字的数字化编辑提供了一个新思路。相似文献

4.

面向书写教学的手写汉字图像笔画还原

荀恩东吕晓晨安维华孙燕南《北京大学学报(自然科学版)》2015,51(2):241-248

为了实现智能化汉字书写教学,提出一种手写汉字图像的笔画还原方法。首先提取手写汉字图像的骨架;然后从知识工程的角度出发,利用字形中稳定的拓扑信息,消除骨架中的歧义变形;最后利用A*算法建立并求解手写汉字与相应模板汉字的字形相似度模型,从而分割出手写汉字图像中的各个笔画,并输出它们与模板汉字中各个笔画的对应关系。此方法的笔画还原结果可以应用于手写汉字规范性的自动化评判等场合。相似文献

5.

一种汉字笔画自动提取基准测试库

陈旭东连宙辉唐英敏肖建国《北京大学学报(自然科学版)》2016,52(1):49-57

构建一个提供评测工具的笔画基准测试库, 其中包含一个人工搭建的笔画数据库, 该数据库拥有4种字体的汉字图像以及对应的人工提取的笔画信息。通过比较算法自动提取的笔画结果和数据库中的标准笔画之间的差异, 测试库可以评测笔画自动提取算法的性能。还提出一种新的基于Delaunay三角剖分的方法, 可以有效地从汉字图像中提取出笔画信息。在测试库中对现有的3 种笔画提取方法进行比较, 实验数据表明, 所提出的笔画基准测试库能够对笔画提取算法给出有效的评测, 并且新的算法在汉字笔画提取的性能中效率较高。相似文献

6.

一种汉字笔画自动提取基准测试库（英文）

《北京大学学报(自然科学版)》2016,(1)

构建一个提供评测工具的笔画基准测试库,其中包含一个人工搭建的笔画数据库,该数据库拥有4种字体的汉字图像以及对应的人工提取的笔画信息。通过比较算法自动提取的笔画结果和数据库中的标准笔画之间的差异,测试库可以评测笔画自动提取算法的性能。还提出一种新的基于Delaunay三角剖分的方法,可以有效地从汉字图像中提取出笔画信息。在测试库中对现有的3种笔画提取方法进行比较,实验数据表明,所提出的笔画基准测试库能够对笔画提取算法给出有效的评测,并且新的算法在汉字笔画提取的性能中效率较高。相似文献

7.

基于改进生成对抗网络的汉字字体生成算法

王江江黄星宇战国栋《大连民族学院学报》2021,23(3):261-267

为解决现有字体模型不完善的笔画连接、不正确的拓扑结构、字形模糊等伪影问题,提出了一种基于改进条件生成对抗网络的汉字字体生成算法.本算法将字体生成任务视为图像转换问题,提出FontToFont和MSAFont两种自动字体生成方法.针对现有汉字字体生成模型存在的问题,提出了基于改进条件生成对抗网络的汉字字体生成算法FontToFont,通过引入U-Net网络结构,可以使生成器保存更详细的信息,并有利于模型性能.建立一种基于多种风格汉字字体的数据集,定性定量验证模型的性能.提出的这种基于改进条件生成对抗网络的汉字字体生成算法,能够从多风格汉字字体中的一部分字体生成高质量的一整套汉字字体.通过设计师的评价及模型消融实验,生成字体的视觉质量和完整度效果良好. 相似文献

8.

基于局部信息的手写汉字笔画提取

范勇峰李成城林民郭振东《内蒙古师范大学学报(自然科学版)》2023,(2):181-188

现有计算机在指导手写汉字练习与测试中，指导依据大都基于全局特征，缺少基于更细粒度特征。提出一种基于局部信息的手写汉字笔画提取方法，为手写汉字评价与指导等任务提供数据支持。首先提取出汉字骨架并对骨架中的毛刺与断裂等问题进行优化；然后使用PBOD算法提取汉字交叉区域后，对交叉区域进行合并删除，消除笔画形变，通过局部信息计算笔画段的组合系数，根据组合系数提取笔画；最后根据获取到的笔画数与算法迭代次数，动态调整组合系数阈值，保证在正确连接笔画段的前提下提取到更可能多的笔画。将该方法在手写汉字数据集上进行实验，其准确率、召回率与F1值分别达到了95.91%、95.71%与95.81%，可用于后续的手写汉字评判与指导等任务。相似文献

9.

面向字形分析的联机手写汉字规整化算法的设计

赵海春莲花《内蒙古民族大学学报(自然科学版)》2010,25(2):145-147

本文着重介绍了将经过相关处理后的联机手写输入的汉字,以笔画为单位规整化为笔段网格描述字形的相关算法.为进一步的汉字字形分析、计算等处理建立了可靠的基础. 相似文献

10.

一种湘西民间苗文字形的动态生成方法及其实现途径

莫礼平周恺卿《北京大学学报(自然科学版)》2016,52(1):141-147

为了有效地解决湘西民间苗文字形的生成及描述问题, 提出一种字形的动态生成方法。该方法将苗文字形的生成过程表示为由苗文构件作为操作数、由构件位置关系决定运算符的组合运算表达式, 将2~3个构件进行不同的组合运算, 即可动态生成不同结构的苗文字形。利用操作系统自带的表意文字描述序列解释机制, 将构件组合运算表达式转换为表意文字描述序列, 即可实现该方法。测试结果表明, 根据该方法编写的映射脚本生成的湘西民间苗文字形可以满足实用要求。相似文献

11.

基于语义构件的甲骨文字库自动生成技术研究

吴琴霞栗青生高峰《北京大学学报(自然科学版)》2014,50(1):161

针对甲骨文字形多变、异体字多等特点, 通过对甲骨字的构成分析, 提出一种基于语义构件的甲骨文字库自动生成方法。该方法以动态描述库为基础, 通过算法提取甲骨字的构件特征信息, 重组笔元生成语义构件, 再给语义构件加上特征描述生成构件知识库。通过仿射变换重复使用语义构件自动生成任意甲骨字。实验表明, 该方法能有效解决甲骨文无字库输入的实现, 还可以解决甲骨字编码、构件统计、未释字的考释等。相似文献

12.

基于部件拼接的高质量中文字库自动生成系统

刘成东连宙辉唐英敏肖建国《北京大学学报(自然科学版)》2018,54(1):35-41

针对中文字库制作开销过大的问题, 提出一种基于部件拼接的高质量中文字库制作方法。参考汉字相关规则与信息, 选取供用户书写的少量汉字集合, 将书写的汉字分割至部件级别。根据汉字部件成字关系, 拼接产生剩余汉字, 最终生成完整GB2312标准(共包含6763个中文字符)的高质量中文字库。实验表明, 所提出的字库制作系统实现了快速生成个性化中文字库的功能, 在保证生成字库质量的前提下, 显著降低了个性化中文字库的制作时间。相似文献

13.

一种古籍汉字图像的多属性模糊检索模型

齐艳媚田学东张充李亚康《河北大学学报(自然科学版)》2020,40(6):657-665

针对古籍汉字结构复杂、风格多变以及字形图像降质所导致传统文字图像检索技术在应用于古籍汉字图像时性能不佳的问题,引入犹豫模糊集理论,提出了一种古籍汉字图像检索模型.首先,设计面向古籍汉字图像的重叠模糊规范化双弹性网格划分,通过考察当前网格与其近邻网格间各种字形要素间的几何和统计特征,定义相应的犹豫模糊元素,进而构成古籍汉字查询图像和目标图像的犹豫模糊集合;其次,以犹豫模糊集合的加权距离测度作为古籍汉字查询图像和目标图像的相似性测度,得到古籍汉字图像检索结果的有序输出.本文算法在11 574幅古籍汉字图像上的检索查准率和查全率分别为78.9%和76.5%. 相似文献

14.

汉字识别中图特征提取方法

唐善成梁少君戴风华来坤曹瑶倩《科学技术与工程》2024,24(2):658-664

为解决图像像素表示汉字特征方法不能有效表示汉字本质特征、空间复杂度较高的问题,提出了一种汉字图特征提取方法。方法主要包含汉字图像二值化,汉字图像骨架提取,汉字图特征提取3个部分;二值化消除图像中的噪声,提高图特征提取的准确度;骨架提取保留图像中重要的像素点,剔除无关的像素点;图特征提取将汉字关键点与图数据结构结合来表示汉字形状特征。在3 908个常用汉字的5种字体上进行实验。结果表明,该方法能够正确提取笔画复杂汉字的图特征,有效表示汉字本质特征;不同字体汉字图特征相同的汉字数量最高为3 195个,方法表现较稳定;平均每个汉字可以用22.6个图节点、19.1个边表示,相较于用单通道图像表示汉字特征,可大幅降低空间复杂度。相似文献

15.

融合中文字形和字义的字向量表示方法

唐善成张雪张镤月王瀚博陈明《科学技术与工程》2021,21(32):13787-13792

字向量表示质量对中文文本处理方法有重要影响。目前,常用中文字向量表示方法Word2Vec、GloVe在很多任务中表现优异,但存在向量质量依赖训练数据集、稳定性差、没有考虑汉字整体字形结构所隐含的语义信息、没有利用字典包含的语言知识等问题。为了克服现有方法的不足,该文首先采用字形自编码器自动捕获汉字字形蕴含的语义,再利用字义自编码器抽取字典包含的稳定字义信息,提出了融合中文字形和字义的字向量的表示方法(Glyph and Meaning to Vector)。结果表明,GnM2Vec在近邻字计算、中文命名实体识别和中文分词三项任务中均取得了较好的结果,在命名实体识别中,F1值较GloVe、word2vec、G2Vec(基于字形向量)分别提高了2.25、0.05、0.3;在中文分词中,F1值分别提高了0.3、0.14、0.33,提高了字向量稳定性。相似文献

16.

汉字笔画若干数据的统计方法研究与应用 总被引：5，自引：0，他引：5

吴建国俞庆英吴海辉《安徽大学学报(自然科学版)》2005,29(3):14-20

统计汉字笔画信息的各种数据,这些数据主要包括:每个汉字的平均笔画数及按使用频度加权的平均笔画数、以各种笔画起笔的汉字数目、各种笔画在汉字字库中的出现次数、汉字字库中笔画相同的汉字、能与其他字区分开的汉字前若干笔画数的平均数与加权平均数以及汉字字库中相邻笔画的频度等。统计的数据对于基于笔画的汉字输入法和汉字的联机手写识别等方面具有重要的指导意义,我们根据这些统计资料设计了标准键盘和数字键盘,并在Windows下实现了以上两种笔画输入法。相似文献

17.

汉字的层次轮廓特征及其应用 总被引：5，自引：0，他引：5

马少平夏莹朱小燕《清华大学学报(自然科学版)》1995,(5)

汉字特征的描述与匹配，是汉字识别研究中的两个重要问题。从上下左右四个不同的方向看一个汉字，在不同的层次和位置，可以得到不同的曲线段，这些曲线段是汉字笔划的反映，唯一地确定了汉字的结构。基于这一观点，本文从轮廓的角度，给出了汉字特征的一种形式化描述方法，提出了汉字的层次轮廓概念，给出了相应的局部最优匹配算法，最后，将该方法应用于特定人脱机手写体汉字识别中，取得了较为理想的效果。相似文献