首页 | 本学科首页   官方微博 | 高级检索  
     

基于重定位的维、哈、柯文Unicode 编码及多文种索引技术研究
引用本文:维尼拉·木沙江,吐尔地·托合提,吐尔洪·吾司曼. 基于重定位的维、哈、柯文Unicode 编码及多文种索引技术研究[J]. 郑州大学学报(理学版), 2009, 41(1)
作者姓名:维尼拉·木沙江  吐尔地·托合提  吐尔洪·吾司曼
作者单位:新疆大学信息科学与工程学院,乌鲁木齐,830046
基金项目:新疆维吾尔自治区高技术研究与发展计划项目,新疆维吾尔自治区高校科研计划重点项目
摘    要:没有语言ID的维、哈、柯文部分字母在Unicode代码区域中共享字符代码,因此在信息交换、自动分词和检索应用中,很难区分维、哈、柯文字母.存在语言上的二义性.另外,该区域中字母的顺序符合阿拉伯字母表,维、哈、柯文字母的顺序非常混乱,这对于维、哈、柯多文种数据的索引、排序和查询处理带来了很大困难.针对以上问题,研究了一种内部Unicode编码方法和基于词根的多文种索引技术.研究结果表明,这种方法完全解决了多文种信息的存储、排序等数据库管理问题,大大简化了索引技术及实现难度.

关 键 词:Unicode  RuniForm  MD5  倒排索引

Research on the Uyghur,Kazak and Kyrgyz Relocated Unicode Format and Multilingual Indexing Approach
WINIRA Musaian , TURDI Tohti , TURGHUN Osman. Research on the Uyghur,Kazak and Kyrgyz Relocated Unicode Format and Multilingual Indexing Approach[J]. Journal of Zhengzhou University(Natrual Science Edition), 2009, 41(1)
Authors:WINIRA Musaian    TURDI Tohti    TURGHUN Osman
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号