基于重定位的维、哈、柯文Unicode 编码及多文种索引技术研究 Research on the Uyghur,Kazak and Kyrgyz Relocated Unicode Format and Multilingual Indexing Approach期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于重定位的维、哈、柯文Unicode 编码及多文种索引技术研究

引用本文：	维尼拉·木沙江,吐尔地·托合提,吐尔洪·吾司曼. 基于重定位的维、哈、柯文Unicode 编码及多文种索引技术研究[J]. 郑州大学学报(理学版), 2009, 41(1)

作者姓名：	维尼拉·木沙江吐尔地·托合提吐尔洪·吾司曼

作者单位：	新疆大学信息科学与工程学院,乌鲁木齐,830046

基金项目：	新疆维吾尔自治区高技术研究与发展计划项目，新疆维吾尔自治区高校科研计划重点项目

摘要：	没有语言ID的维、哈、柯文部分字母在Unicode代码区域中共享字符代码,因此在信息交换、自动分词和检索应用中,很难区分维、哈、柯文字母.存在语言上的二义性.另外,该区域中字母的顺序符合阿拉伯字母表,维、哈、柯文字母的顺序非常混乱,这对于维、哈、柯多文种数据的索引、排序和查询处理带来了很大困难.针对以上问题,研究了一种内部Unicode编码方法和基于词根的多文种索引技术.研究结果表明,这种方法完全解决了多文种信息的存储、排序等数据库管理问题,大大简化了索引技术及实现难度.
关键词：	Unicode RuniForm MD5 倒排索引
Research on the Uyghur,Kazak and Kyrgyz Relocated Unicode Format and Multilingual Indexing Approach

WINIRA Musaian , TURDI Tohti , TURGHUN Osman. Research on the Uyghur,Kazak and Kyrgyz Relocated Unicode Format and Multilingual Indexing Approach[J]. Journal of Zhengzhou University(Natrual Science Edition), 2009, 41(1)

Authors:	WINIRA Musaian TURDI Tohti TURGHUN Osman

Abstract:

Keywords:
本文献已被万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏