首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 203 毫秒
1.
针对汉字字形设计和开发的困难, 提出基于特征点抽象的汉字字形描述方法和汉字字形生成方法, 研究特征点、特征表达式、特征点的权值和权矢量等在汉字字形生成中的应用技术和方法, 并以点的生成为例, 设计汉字点笔画的生成算法, 并进行验证实验。实验结果证明该算法可靠并实用, 可切实提高汉字字形设计的效率, 为汉字其他笔画的生成提供一种解决方案。  相似文献   

2.
吴琴霞 《科学技术与工程》2013,13(15):4426-4432
目前汉字字形的生成仍是手工劳动和人工设计,加上汉字数据量巨大截止到现在没有一种合适的字形自动化生成工具可以使用。针对这一难题提出了一种基于字形描述库的汉字字形自动生成的技术。该技术先将汉字字形与字形描述库映射,以字形描述库为桥梁将汉字字形数据化,然后通过查找字形描述库找到汉字对应的骨架信息,提取笔画骨架。最后通过数据的逆向处理将笔画骨架信息还原为各种汉字字形,形成汉字字形库。  相似文献   

3.
汉字是象形文字,其字形特征对于中文命名实体识别有着重要的作用。针对双向长短期记忆模型(bi-directional long short-term memory,BiLSTM)提取部首,命名实体识别准确率不高的问题,提出笔画组成编码器,用于获取汉字的字形特征,并将笔画字形特征向量和预训练的语言表征模型(bidirectional encoder representation from transformers,BERT)输出的字向量进行拼接,将拼接后的向量放入双向长短期记忆模型与条件随机场(conditional random field,CRF)相连的标注模型(BiLSTM-CRF)中进行命名实体识别。实验表明,所提的方法在Resume数据集上命名实体识别准确率有显著提升。相较于用卷积神经网络做编码器提取汉字字形特征,准确率高出0.4%。相较于使用BiLSTM提取的部首特征模型和加入词典的长短期记忆模型(Lattice LSTM)模型其准确率分别提升了4.2%、0.8%。  相似文献   

4.
提出一种基于三维空间信息的字形匹配方法。首先将字形轮廓Bézier 曲线的二维控制点集扩展至三维, 然后为三维点集建立高斯混合模型, 最后通过最小化高斯混合模型间的欧氏距离(L2)完成匹配。采用三维空间信息可以充分利用字形所蕴含的内在约束条件。采用高斯混合模型有利于在匹配过程中保持字形整体结构特征和局部书写特征。实验结果表明, 该方法提升了汉字单笔画以及整字字形匹配的准确度和美观度, 并且具有稳定性高、扩展性强的特点。  相似文献   

5.
从汉字自身结构特点入手,介绍了一种面向中文移动通讯产品的点阵汉字压缩与还原新技术的研究和实现.利用汉字结构上的冗余特性,通过对汉字结构的分解和组合,实现对点阵汉字的高效压缩和还原.文中讨论了这种压缩与还原技术的主要设计思想以及笔划微调、笔锋自动生成和点阵字形与矢量字形的并行存储等重要处理技术.最后,给出了实际的点阵汉字压缩与还原系统的详细描述.经实际使用证明,采用文中所讨论的点阵汉字压缩与还原技术,可以很好地满足中文移动通讯产品的需要  相似文献   

6.
为解决现有中文字向量表征方法中字形特征利用不充分的问题,利用矢量图形的尺度不变性,提出了一种面向汉字矢量图形特征的字向量 (scalable vector graphics to vector,SVG2vec)表征方法。预处理阶段将汉字像素图像转化矢量图形,生成字形矢量坐标对序列;特征学习阶段采用双向循环神经网络 (Recurrent Neural Network, RNN)和自回归混合密度循环神经网络构建矢量图形变分自编码器模型,利用模型学习汉字字形结构特征;向量生成阶段输入字形矢量坐标对序列到编码器,编码器将字形特征映射到概率连续分布空间,得到SVG2vec字向量。与已有字向量在不同层级任务上进行对比实验。结果表明:SVG2vec向量在命名实体识别、中文分词和短文本相似度计算实验中,F1均值比Word2vec、GloVe等未利用字形特征的向量分别提高了1.27、0.4,1.67、0.12,3.28、2.03,比glyph and meaning to vector (GnM2Vec)、Character-enhanced Word Embedding (CWE)等利用字形特征的向量分别提高了1.02、1.07,1.69、1.34,0.04、0.31,SVG2vec能更有效利用汉字字形特征。  相似文献   

7.
汉字创意设计就是将特定汉字的个性化内涵用现代设计技巧表现出来.本文从分析汉字字形与字意入手,着重论述了汉字创意设计的七种有效方法.  相似文献   

8.
本文通过对汉字结构美感的分析,概括和分析出汉字特定的形态美学。并找到其与现代平面图形设计的内在规律相契合的地方,探索和研究这种字形美的特质对现代平面图形设计的作用。  相似文献   

9.
本文将三次B-样条小波变换用于汉字字形压缩。在汉字字形压缩过程中,用三次B-样条曲线表示汉字字形轮廓线,通过样条小波变换将曲线控制点分解为变换域系数或者不同层次的控制点,根据系数与控制点,采用两种算法实现汉字字形压缩,再用存储的系数或控制点恢复压缩的汉字。从计算机仿真结果看,该方法具有一定应用价值。  相似文献   

10.
针对古籍汉字结构复杂、风格多变以及字形图像降质所导致传统文字图像检索技术在应用于古籍汉字图像时性能不佳的问题,引入犹豫模糊集理论,提出了一种古籍汉字图像检索模型.首先,设计面向古籍汉字图像的重叠模糊规范化双弹性网格划分,通过考察当前网格与其近邻网格间各种字形要素间的几何和统计特征,定义相应的犹豫模糊元素,进而构成古籍汉字查询图像和目标图像的犹豫模糊集合;其次,以犹豫模糊集合的加权距离测度作为古籍汉字查询图像和目标图像的相似性测度,得到古籍汉字图像检索结果的有序输出.本文算法在11 574幅古籍汉字图像上的检索查准率和查全率分别为78.9%和76.5%.  相似文献   

11.
针对目前部分汉字字体设计作品单纯以形式表象作为其创作思路的片面性,提出了汉字字体设计意象化表现的重要性.从前沿的字体设计理论出发,深入剖析汉字字体设计之"意"的内在意境,和"象"的识别性、艺术性和整体性.结合相关理论运用例证的方法,重新阐释了汉字字体设计意象表现的内在创意思维、文化内涵、价值取向和审美取向,总结出汉字意象化设计的新理念和创新应用方法,从而为现代汉字字体设计提供一定的设计思路和启示.  相似文献   

12.
马晓风  刘颖 《菏泽学院学报》2007,29(3):87-89,142
影响字形识别的因素有很多,包括笔划、部件、字频、字形结构、整体与部分的关系、语音等。有关字形识别的理论有很多,各种理论虽然都能解释一些问题,但是在某些方面均有着一定不足,不管怎样,它们都对字形研究有贡献。  相似文献   

13.
本文提出了组合式汉字库的构想,讨论了该数据库的层次模型和系统组成,阐明了笔划、字元索引库、汉字索引库的关系,以及数据结构和实现方法,最后指出了该汉字库与现有汉字库比较的优点和需要进一步探讨的问题。  相似文献   

14.
Premiere Pro CS3是Adobe公司开发的一款功能强大的影视作品编辑软件,但在字幕制作上有一个明显的不足。即使是汉化版的Premiere Pro CS3,字幕设计器中的字符面板也不能以中文显示中文字体名称与中文字体样式。本文就是针对该问题,分析阐述了三种显示中文字体名称与中文字体样式的方法。  相似文献   

15.
针对中文字库制作开销过大的问题, 提出一种基于部件拼接的高质量中文字库制作方法。参考汉字相关规则与信息, 选取供用户书写的少量汉字集合, 将书写的汉字分割至部件级别。根据汉字部件成字关系, 拼接产生剩余汉字, 最终生成完整GB2312标准(共包含6763个中文字符)的高质量中文字库。实验表明, 所提出的字库制作系统实现了快速生成个性化中文字库的功能, 在保证生成字库质量的前提下, 显著降低了个性化中文字库的制作时间。  相似文献   

16.
由于矢量汉字库较点阵汉字库有许多优点,特别在字型变换如平移、缩放、旋转、倾斜、投影等方面,利用矢量字库进行字型变换算法简单、速度快、失真小、因此效果好。本文分析了UCDOS3.1量汉字库的存贮结构并给出了定型还原算法。  相似文献   

17.
在BNF范式编码的基础上,深入讨论了生僻汉字数字化处理问题。根据对生僻汉字部件的统计和分析,本文提出了基于编码的生僻汉字输入方法,建立了相应的生僻汉字部件库,实现了生僻汉字的数字存储和显示。此外,应用测试用例自动生成的方法,对输入方法进行了测试,表明该方法具有造字速度快,应用范围广,与现有字体兼容性强等优点,从而为生僻汉字的数字化提出了一个新的解决方案。  相似文献   

18.
构建一个提供评测工具的笔画基准测试库, 其中包含一个人工搭建的笔画数据库, 该数据库拥有4种字体的汉字图像以及对应的人工提取的笔画信息。通过比较算法自动提取的笔画结果和数据库中的标准笔画之间的差异, 测试库可以评测笔画自动提取算法的性能。还提出一种新的基于Delaunay三角剖分的方法, 可以有效地从汉字图像中提取出笔画信息。在测试库中对现有的3 种笔画提取方法进行比较, 实验数据表明, 所提出的笔画基准测试库能够对笔画提取算法给出有效的评测, 并且新的算法在汉字笔画提取的性能中效率较高。  相似文献   

19.
汉字笔画若干数据的统计方法研究与应用   总被引:5,自引:0,他引:5  
统计汉字笔画信息的各种数据,这些数据主要包括:每个汉字的平均笔画数及按使用频度加权的平均笔画数、以各种笔画起笔的汉字数目、各种笔画在汉字字库中的出现次数、汉字字库中笔画相同的汉字、能与其他字区分开的汉字前若干笔画数的平均数与加权平均数以及汉字字库中相邻笔画的频度等。统计的数据对于基于笔画的汉字输入法和汉字的联机手写识别等方面具有重要的指导意义,我们根据这些统计资料设计了标准键盘和数字键盘,并在Windows下实现了以上两种笔画输入法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号