首页 | 本学科首页   官方微博 | 高级检索  
     检索      

大型藏语平衡语料库建设中样本类别号的研究
引用本文:高定国,索郎桑姆.大型藏语平衡语料库建设中样本类别号的研究[J].西藏大学学报,2013(1):54-58.
作者姓名:高定国  索郎桑姆
作者单位:西藏大学工学院 西藏拉萨850000
基金项目:2011年度国家自然科学基金项目“基于虚词的藏语基本句型的形式化研究”(项目号:61063015);2011年度国家自然科学基金项目“藏语依存树库的构建”(项目号:61163043);2005年度年度国家语委项目“大型藏文基础语料库建设”(项目号:MZ115-039);2011年度西藏自治区科技计划项目“基于语料库的藏语词汇计量研究”阶段性成果
摘    要:藏文语料库是计算机研究藏语规律的素材,建设藏语语料库是藏文信息处理研究的基础和前提。语料库建设中样本的类别号是识别样本类别的依据,也是关联藏文语料信息库、样本文档和使用者的纽带,在语料库建设中非常重要。文章结合藏语平衡语料库的建设,设计了藏文语料数据库,划分了藏文语料库的类别并设计实现了样本类别号的产生方法。

关 键 词:藏语  语料库  样本  类别号

Research on the Type number of Samples in the Construction of Large Tibetan Language Balanced Corpus
Gao Ding-guo , Sonam-Sangmu.Research on the Type number of Samples in the Construction of Large Tibetan Language Balanced Corpus[J].Journal of Tibet University,2013(1):54-58.
Authors:Gao Ding-guo  Sonam-Sangmu
Institution:Gao Ding-guo Sonam-Sangmu(School of Engineering,Tibetan University,Lhasa Tibet 850000,China)
Abstract:
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号