首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于汉维医疗平行语料的双语术语抽取研究
引用本文:于清,常乐,徐健,刘天毅,LI Xiao-long.基于汉维医疗平行语料的双语术语抽取研究[J].内蒙古大学学报(自然科学版),2018(5).
作者姓名:于清  常乐  徐健  刘天毅  LI Xiao-long
作者单位:新疆大学信息科学与工程学院;新疆大学软件学院;Academy
摘    要:为提高汉语和维吾尔语医学领域机器翻译质量,解决人工提取和翻译大量医学术语耗时费力的问题,提出基于词向量表示的双语术语抽取方法,并与传统统计短语对齐抽取进行对比.首先,自建45216句汉语医疗语料,人工翻译获得23996句维语语料,人工采集汉语医学词汇65394条,翻译获得31421条维语术语,对汉语语料分词,对维语语料形态切分,获得实验数据;其次,使用词向量方法,设计了基于词向量表示的双语术语抽取实验,准确率为25.12%;并将传统统计短语对齐抽取技术应用于汉维医疗平行语料,准确率为27.28%;实验结果表明,新方法更需要大量平行语料支持,但是两种方法都有助于提高汉维医学领域机器翻译质量,使提取和翻译大量医学术语自动化.

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号