维吾尔语词向量的评测研究 |
| |
引用本文: | 吴浩,艾山·吾买尔,王路路,卡哈尔江·阿比的热西提,吐尔根·依布拉音.维吾尔语词向量的评测研究[J].厦门大学学报(自然科学版),2019(2). |
| |
作者姓名: | 吴浩 艾山·吾买尔 王路路 卡哈尔江·阿比的热西提 吐尔根·依布拉音 |
| |
作者单位: | 新疆大学信息科学与工程学院新疆多语种信息技术实验室 |
| |
摘 要: | 目前探究维吾尔语词向量表示的相关研究报道很少,在对其性能评价、实际使用等方面存在一些问题亟待解决.基于此,构建了维吾尔语版wordsim240和word analogy词向量评测数据集;提出了新的单词语义相似度评测方法,并以命名实体识别任务作为实际任务验证其有效性;同时分析了改进的类比推理评测方法鉴别词向量表示语义的能力.实验结果显示,提出及改进的方法均能有效应用于评测任务;且在较小语料规模下,较低维度(64,128,256维)的词向量在各项评测任务上表现更好.
|
本文献已被 CNKI 等数据库收录! |
|