藏文单音节单纯词抽取方法设计与实现 |
| |
引用本文: | 才让东知,祁坤钰,贡保杰布.藏文单音节单纯词抽取方法设计与实现[J].西北民族学院学报,2023(3):16-24. |
| |
作者姓名: | 才让东知 祁坤钰 贡保杰布 |
| |
作者单位: | 1. 西北民族大学甘肃省民族语言智能处理重点实验室;2. 西北民族大学中国民族语言文字信息技术教育部重点实验室;3. 青海师范大学计算机学院 |
| |
基金项目: | 国家自然科学基金项目“面向长序列的文档级神经机器翻译关键技术研究”(62266038); |
| |
摘 要: | 针对藏文词汇资源匮乏和词汇分级模糊等问题,采用词典语料和词性标注语料相结合的方法,设计了藏文单音节单纯词抽取模型,规划了详细的技术方案,构建了比较完整的词典语料库,获得了藏文单音节单纯词的分类词表,依据相对通用度得到了分级词表,其中名词、动词、形容词、副词和数词等单音节单纯词总数1414条,词性之间存在大量的兼类现象,对汉藏语言资源库建设具有重要意义.
|
关 键 词: | 藏文单纯词 抽取模型 语料库 |
|
|