共查询到19条相似文献,搜索用时 125 毫秒
1.
在BNF范式编码的基础上,深入讨论了生僻汉字数字化处理问题。根据对生僻汉字部件的统计和分析,本文提出了基于编码的生僻汉字输入方法,建立了相应的生僻汉字部件库,实现了生僻汉字的数字存储和显示。此外,应用测试用例自动生成的方法,对输入方法进行了测试,表明该方法具有造字速度快,应用范围广,与现有字体兼容性强等优点,从而为生僻汉字的数字化提出了一个新的解决方案。 相似文献
2.
古籍电子化中生僻汉字的处理 总被引:3,自引:0,他引:3
“字库不够用”的问题是古籍电子化的一大障碍,文中就古籍电子化中遇到的生僻汉字问题进行了深入研究,在对生僻汉字进行分析统计的基础上,进而对其进行编码、造字。又根据生僻汉字的特点,设计了易学易用的输入法,从而,实现了古籍电子化中遇到的生僻汉字的存储、检索和显示,较好地解决了古籍电子化中遇到的生僻汉字问题。 相似文献
3.
在进行文字编辑时我们经常会遇到生僻汉字录入计算机和word文档难的问题,本文将生僻汉字分为两类分别列举不同的解决方案,对于GBK包括的生僻汉字,我们可以用支持GBK大字符集的输入法录入;对于GBK以外的生僻汉字,我们可以用插入自造字字库,word组字,True Type造字程序造字和画图工具造字四种录入,同时还提供了三种可以使含有生僻汉字的文档正常显示和打印的方法. 相似文献
4.
5.
6.
以英语测试与问卷调查的方式,对生僻英语地名、人名影响阅读理解的问题进行了研究。在测试中以英语专业大一学生为研究对象,44名受试者被降机分为两组。使用的材料是两套阅读试题,试卷短文内容相同,涉及生僻英语地名、人名。一组被试接受的阅读试卷是含有生僻英语地名卷、人名卷;另一组被试的阅读试卷是生僻英语地名卷、人名释义卷。通过对问卷调查结果和实验数据统计分析得出结论,生僻英语地名巷、人名对EFL学生阅读理解产生影响。 相似文献
7.
针对中文字库制作开销过大的问题, 提出一种基于部件拼接的高质量中文字库制作方法。参考汉字相关规则与信息, 选取供用户书写的少量汉字集合, 将书写的汉字分割至部件级别。根据汉字部件成字关系, 拼接产生剩余汉字, 最终生成完整GB2312标准(共包含6763个中文字符)的高质量中文字库。实验表明, 所提出的字库制作系统实现了快速生成个性化中文字库的功能, 在保证生成字库质量的前提下, 显著降低了个性化中文字库的制作时间。 相似文献
8.
基于数据库技术的汉字处理方法研究 总被引:1,自引:0,他引:1
李晶 《云南大学学报(自然科学版)》2007,(Z2)
汉字的点画结构使其在信息化处理中面临许多困难.本文从汉字的字型结构出发,研究数据库技术在汉字处理中的应用,提出将汉字拆分成部件,将汉字部件、汉字结构类型和部件拼接变形算法等基本数据用数据库进行管理,作为各种汉字处理应用的基础数据平台的思路和方法.在此平台之上,可以实现汉字字库生成等功能,为减小汉字图像存储量,实现风格多样的电脑汉字艺术等提供帮助. 相似文献
9.
从汉字的结构特征出发,定义了表示汉字的结构文法,给出了相应汉字的语法树和编码表达式,并成功地把它们应用于汉字信息统计方面,具有一定的实用价值。 相似文献
10.
彭绪富 《高等函授学报(自然科学版)》1998,(4):42-42,F003
随着计算机应用的日渐广泛及计算机教育在中小学和高校的逐渐普及,汉字信息处理已经成为当前十分重要的课题。汉字是由不同数量、不同功能的部件依照不同结构方式组合而合的。部件的数量、功能和组合方式是每个汉字区别于其它汉字最重要的属性。将组成汉字的部件拆分出来是汉字字形处理中首要的基础工作,因此,在相当长的一个时期内,不同地区。不同系统自发地进行了部件拆分,其结果是纷坛交错,五花八门,形成了人们常说的万"码"奔腾的局面。在对汉字拆分上,有的甚至从自己的编码需要出发,对汉字任意"肢解",这种混乱局面对计算机应用… 相似文献
11.
针对一些具有汉字汉字显示的实时控制软件需要在西文DOS下运行而带来的汉字显示问题加以讨论研究,提出了一种特别适合此类软件在西文DOS下运行,实现汉字显示的方法,即利用专用汉字库来实现汉字显示的方法,并介绍了专用汉字库生成的原理、方法和使用。 相似文献
12.
汉字笔画若干数据的统计方法研究与应用 总被引:5,自引:0,他引:5
统计汉字笔画信息的各种数据,这些数据主要包括:每个汉字的平均笔画数及按使用频度加权的平均笔画数、以各种笔画起笔的汉字数目、各种笔画在汉字字库中的出现次数、汉字字库中笔画相同的汉字、能与其他字区分开的汉字前若干笔画数的平均数与加权平均数以及汉字字库中相邻笔画的频度等。统计的数据对于基于笔画的汉字输入法和汉字的联机手写识别等方面具有重要的指导意义,我们根据这些统计资料设计了标准键盘和数字键盘,并在Windows下实现了以上两种笔画输入法。 相似文献
13.
汉四码汉字输入法的编码方法 总被引:1,自引:0,他引:1
介绍一种新的音形结合汉字输入法——汉四码的编码方法.其设计思想是根据《现代汉语词典》、《四角号码词典》的检字规则,依据汉字中14种笔形的谐音和字典检字表中部首的首音,编制了汉四码的笔形码元、字根码元对照表,绘制了字根键盘分布图。并根据汉字的结构和笔顺设计了字和词的编码方案. 相似文献
14.
15.
为实现按部件快速检索汉字,把汉字递归表示为汉字结构、字首部件和字尾部件三元组。以部件为运算对象,字型结构为运算符,将汉字描述为前缀表达式。提出汉字表达式的双链表存储模型,设计双链表生成算法及基于双链表存储的检索方法。与直接采用数组存储相比,使用双链表存储时检索的平均比较次数仅为数组存储的50%,并易于动态提升检索性能。 相似文献
16.
17.
汉字编码输入方法评测的理论与实践,日益受到重视。以单个汉字为编码对象的评测已经不能适应编码技术发展的需要。本文为适应新的测试要求,提出了在字、词混合输入状态下编码效率和最高键入速率的计算公式及相应的计算机测试方法,可为提高对被测方案速率素质评估的可靠性和科学性、大大缩减动态测试的时间和经费提供了有利条件。 相似文献
18.
杨奇 《天津大学学报(自然科学与工程技术版)》1993,(1):154-157
七笔形声输入法是一种形码与音码相结合的汉字输入法。它确立横,竖,撇,点,折,钩,方7种笔形,从它们的组合笔形中筛选出26种作为码元,再挑选26个与形码元有联系的代表字,将各形码元和代表字分别配于26年拉丁字母作为代码,按所给编码规则,每个字至多3个形码和1个音码,该输入法限制性因素少,适应范围广,成本低,重码率低,击键次数少,应用广,用户可在通用机上操作。 相似文献
19.
汉字动态生成的结构与风格模型 总被引:1,自引:0,他引:1
提出一种基于汉字结构和风格的字形生成模型。该模型将汉字字形抽象为汉字结构和汉字风格两种模式,并在结构中将汉字笔画抽象为连续的笔元,通过笔元的特征点构造笔元向量、径向量、弦向量和轭向量,进行笔画风格的重建。通过这种方法,动态产生可用于True type个性化汉字字形设计的字形,实现汉字字形的Web存储和在客户端的特征字形输出,克服了现代汉字由于汉字数量巨大而在字形设计方面的不足,为个性化汉字信息的云端存储和云端字形服务提供了一种有效的策略和方法,为设计更深层次的汉字信息服务奠定了基础。 相似文献