基于高斯分布和汉字组件特征的中文词表示学习 |
| |
作者姓名: | 易洁 钟茂生 刘根 王明文 |
| |
作者单位: | 江西师范大学计算机信息工程学院,江西 南昌330022 |
| |
基金项目: | 国家自然科学基金;国家自然科学基金 |
| |
摘 要: | 使用一种基于密度的分布式嵌入式表示,并给出一种学习高斯分布空间表示的方法,以更好地捕获关于表示及其关系的不确定性,比点积余弦相似度更自然地表达词语的不对称性;同时,针对中文汉字本身特点,将组成汉字的组件即子汉字的语义信息加入词表示训练.与现有方法对比,该文的模型性能在词语相似度或下游任务等方面有更好的效果,且能更好地表...
|
关 键 词: | 词表示学习 高斯分布 汉字组件 语义不确定性 |
本文献已被 万方数据 等数据库收录! |
|