首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
藏文网页搜索是藏文计算机技术和藏文网站发展的必然要求,藏文字的特殊结构和藏文编码的多样性给网页的统一检索造成一定的困难,使用基于Unicode的藏文编码来识别和存储藏文有利于网页搜索的实施。  相似文献   

2.
随着藏文信息技术的不断普及和发展,搜索引擎技术成为藏文信息处理一项新的研究课题.对搜集到的藏文网页文本或用户查询关键词进行理解、提取和组织等处理是搜索引擎的一项基础性工作,其中藏文分词的准确与否,直接影响到搜索引擎查询效果及查询结果列表的排序问题,因此分词成为藏文搜索引擎技术中需要解决的关键问题.文章针对藏文搜索引擎中基于字符串匹配的藏文分词技术进行研究并提出相应的解决算法.  相似文献   

3.
藏文文本资源的收集对藏语信息处理研究有着至关重要的作用.文章在分析国内外藏文网页主要编码方式的基础上,提出了藏文网页的编码识别、自动获取与过滤,文本编码统一转换的算法.系统主要包括网页编码识别网页、自动获取、文本过滤、编码转换等几个模块.在windows平台下对系统的测试结果良好,为藏语电子文本的收集和整理提供了方便、快捷的平台.  相似文献   

4.
近年来,随着互联网技术的迅速发展,藏文网站得到了广泛普及,但是用户通过前台与后台数据库进行藏文数据的交互访问时,在藏文输入上遇到了很多问题,如本机未安装藏文输入法或本机藏文输入法在藏文网页上输入时,输入无法实现或显示不正常、提交出错等问题。针对以上问题,项目组研究开发了基于藏文编码字符集国家标准的一种能够即时、在线输入藏文的输入法。文章阐述了藏文在线输入法的设计思想以及实现过程,介绍了该技术的设计原理以及流程,并给出了与其它网页编辑器的结合方式。  相似文献   

5.
近年来,随着互联网技术的迅速发展,藏文网站得到了广泛普及,但是用户通过前台与后台数据库进行藏文数据的交互访问时,在藏文输入上遇到了很多问题,如本机未安装藏文输入法或本机藏文输入法在藏文网页上输入时,输入无法实现或显示不正常、提交出错等问题.针对以上问题,项目组研究开发了基于藏文编码字符集国家标准的一种能够即时、在线输入藏文的输入法.文章阐述了藏文在线输入法的设计思想以及实现过程,介绍了该技术的设计原理以及流程,并给出了与其它网页编辑器的结合方式.  相似文献   

6.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,文章提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。  相似文献   

7.
文章采用XML技术对藏文网页排版的版式规则进行描述,并通过脚本技术和样式表技术实现了对藏文网页文本的规范排版.  相似文献   

8.
藏文在通用字符集UCS中如何进行编码,是藏文软件开发者在现代计算机系统中处理藏文数据所必须具备的知识之一。在设计藏文网页内容、UCS藏文数据的整理、设计藏文应用软件、藏文文本的处理操作、在设计藏文OpenType字库或者在UCS藏文编码模式应用时,首先都要去理解UCS藏文编码模式。文章介绍了UCS的编码体系结构以及UCS中藏文编码模式的组织结构和设计方法,以便于使用OpenType来支持复杂藏文文本的显示和处理,从而进一步提高藏文文本的编辑效率。  相似文献   

9.
藏文字形结构分析与编译分析   总被引:3,自引:0,他引:3  
藏文字形结构分析与统计分析是藏文字形学包含的必不可少的一部分内容;在藏文文字编码的研究中,要提取规范、相容的部分作为编码的基本元,对变形显现形式,要作大样本的抽样统计,决定编码的取舍;在藏文文字识别的研究中,要用计算机抽取藏文文字的特征,根据机器内预先存放的特征集匹配判别;因此藏文字形结构分析与统计分析在藏文字形学、藏文文字编码以及藏文文字识别的研究中,起着不可估量的作用,意义重大。一、藏文字形的结构分析藏文文字属于一种拼音文字,由三十个辅音字母、四个元音、三个头置字以及四个系足字有规律地左右上…  相似文献   

10.
藏文在通用字符集UCS中如何进行编码,是藏文软件开发者在现代计算机系统中处理藏文数据所必须具备的知识之一。在设计藏文网页内容、UCS藏文数据的整理、设计藏文应用软件、藏文文本的处理操作、在设计藏文OpenType字库或者在UCS藏文编码模式应用时,首先都要去理解UCS藏文编码模式。文章介绍了UCS的编码体系结构以及UCS中藏文编码模式的组织结构和设计方法,以便于使用OpenType来支持复杂藏文文本的显示和处理,从而进一步提高藏文文本的编辑效率。  相似文献   

11.
研究科学、合理的藏文输入方案,使输入法易学、易用、快速和规范是至关重要的.文章强调藏文不“编码”的编码输入表明一种思想:我们不能孤立地讨论编码.藏文拉丁字母转写是一种自然的编码方式,拉丁字母转写转换为藏文的输入不仅在易学、易记、快打、规范以及四者的统一方面有潜力可挖,而且对信息时代的语言规范性研究也有重要意义.  相似文献   

12.
藏文排序在字、词典排序,计算机中藏文的排序等方面有着广泛的应用,文章根据藏文编码国家标准(GB)的整字编码方案,研究藏文的排序问题。通过藏文结构的线性化处理,提出基于藏文编码国家标准的基字定位算法和排序算法,并将应用于藏文电子词典的排序中。  相似文献   

13.
基于藏文编码GB的藏文排序方法研究   总被引:3,自引:0,他引:3  
藏文排序在字、词典排序,计算机中藏文的排序等方面有着广泛的应用,文章根据藏文编码国家标准(GB)的整字编码方案,研究藏文的排序问题。通过藏文结构的线性化处理,提出基于藏文编码国家标准的基字定位算法和排序算法,并将应用于藏文电子词典的排序中。  相似文献   

14.
全文检索是搜索引擎的核心技术之一。由于目前基于LUCENE的中文全文检索正在适应中文信息技术发展的需求等方面进行探索,基于LUCENE的藏文全文检索也需要适应藏文信息技术发展的需求进行新的探索。文章介绍了一种全文检索引擎工具包——LUCENE,并结合当前藏文信息技术现状提出了藏文全文检索相关问题和需要解决的关键问题。  相似文献   

15.
1997 年7 月,国际标准化组织ISO和国际电工委员会IEC表决通过了以中国提案为主的藏文编码字符集.此次发布的藏文编码标准是国际标准ISO/IEC10646《通用多八位编码字符集》的重要组成部分.本文回顾了该标准的研制过程,分析了藏文编码的技术性能指标,论述了它的合理性、科学性和完备性.并建议对藏文上下加变形显形式予以编码,在拼音文字辅助平面建立藏文编码字符集辅助集.  相似文献   

16.
计算机藏文编码性能指标分析   总被引:1,自引:1,他引:1  
从规范性、兼容性、一致性、完备性四个方面分析了计算机藏文国家标准编码性能指标,论述了建立藏文编码体系的必要性和可行性  相似文献   

17.
文章通过对藏文编码国家标准(GB)藏文信息系统之上的藏文排序问题进行研究,提出了基于藏文编码国家标准(GB)的藏文音节及词的排序方法,并给出相应的排序算法,测试结果良好。  相似文献   

18.
藏文编码字符集构件集   总被引:3,自引:1,他引:2  
本文论述了藏文信息结构和构件拆分的原理,采用统计方法,建立了藏文编码字符集构件集,用已编码的藏文字符表示未编码的藏文外字具体字型的结构和内容,说明厂构件集的选取与排序,论证了它的可行性,以期建立全藏文编码体系。  相似文献   

19.
文章基于藏文大字符集编码,同时考虑了现代藏文和梵音藏文的不同结构,穷举了藏文构件的组合形式.参考藏文字典的传统排序方法以及其他字典关于藏梵排序的思想,依据现代藏文结构对梵音藏文进行了归并,将不规则的梵音藏文统一分解成对应于现代藏文不同构件的横向组合,最终提出并实现了基于"字丁拆分"思想的藏梵文混合排序,并对排序的规则和算法进行了详细说明.此方法,概念明确,易于理解,为藏文字典编排,字词的查询和检索提供了基本的方法和工具.  相似文献   

20.
把藏文的特点与微电脑的处理特点结合起来综合研究,找到了电脑处理藏文最有效的途径,通过藏文信息自理系统,藏文字库,藏文音形码输入法的建立将藏文字幕机奉献于电教的百花园中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号