基于深度学习的多语言跨领域主题对齐模型 |
| |
引用本文: | 余传明,原赛,胡莎莎,安璐.基于深度学习的多语言跨领域主题对齐模型[J].清华大学学报(自然科学版),2020,60(5):430-439. |
| |
作者姓名: | 余传明 原赛 胡莎莎 安璐 |
| |
作者单位: | 中南财经政法大学信息与安全工程学院,武汉430073;中南财经政法大学统计与数学学院,武汉430073;武汉大学信息管理学院,武汉430072 |
| |
基金项目: | 国家自然科学基金;国家自然科学基金 |
| |
摘 要: | 在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。
|
关 键 词: | 跨语言主题对齐 跨领域主题对齐 深度学习 双语词嵌入 知识对齐 |
本文献已被 CNKI 万方数据 等数据库收录! |
|