首页 | 本学科首页   官方微博 | 高级检索  
     检索      

用于构建维吾尔文语料库的中文件格式转换技术研究
引用本文:艾斯卡尔·亚克甫,艾孜尔古丽,玉素甫·艾白都拉.用于构建维吾尔文语料库的中文件格式转换技术研究[J].新疆师范大学学报(自然科学版),2012,31(3):11-15.
作者姓名:艾斯卡尔·亚克甫  艾孜尔古丽  玉素甫·艾白都拉
作者单位:1. 中国海洋大学信息科学与工程学院,山东青岛,266000
2. 新疆维吾尔自治区大中专招生办公室,新疆乌鲁木齐,830091
3. 新疆师范大学,新疆乌鲁木齐,830054
基金项目:由新疆维吾尔自治区社科基金,国家科技部科技支撑计划项目,国家自然科学基金项目,国家教育部社科基金,国家语委科研规划项目,国家自然科学基金委重点项目,国家语委“十二五”科研规划项目(YB125-45)等项目的支持
摘    要:文章研究的是在维吾尔文字语料库建立过程中,从MS-DOS系统上排版的书刊,杂志中获得维吾尔语单词,并转换到WINDOWS环境上RTF格式的一种快速解决方法,然后提出维吾尔文字Unicode代码对应的RTF代码表和动态生成维吾尔文RTF文件的简单方法。实践证明这种方法有助于提高语料库构造中的大单词收集的效率和质量。

关 键 词:文件转换  RTF(Reich  Text  Format)  维吾尔文

Research of Construction of the Uyghur Language Corpus File Format Conversion Technology
Institution:Askar·YAKUP1,Azragul2,Yusup·ABAYDUL3 (1.China ocean university information science and engineering college,Qingdao,China; 2.Xinjiang uygur autonomous region college admissions office,Urumqi,China; 3.Xinjiang Normal University,Urumqi,China)
Abstract:This paper mainly studies the RTF files through the analysis of the structure,is a rapid solutions that in the process of building the Uighur text corpus,from former ms-dos system of the publishing books,magazines gain in the Uyghur language words and convert to WINDOWS environment on RTF format.And then put forward the corresponding Unicode characters Uygur RTF code generation timers and dynamic generation Uyghur,RTF files of simple method.The practice proves that this kind of method to solve the corpus of the structure of collected words high efficiency,high rate of accuracy.
Keywords:File conversion  RTF(Reich Text Format)  Uyghur language
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号