基于深度学习的多语言跨领域主题对齐模型期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于深度学习的多语言跨领域主题对齐模型

引用本文：	余传明,原赛,胡莎莎,安璐.基于深度学习的多语言跨领域主题对齐模型[J].清华大学学报(自然科学版),2020,60(5):430-439.

作者姓名：	余传明原赛胡莎莎安璐

作者单位：	中南财经政法大学信息与安全工程学院,武汉430073;中南财经政法大学统计与数学学院,武汉430073;武汉大学信息管理学院,武汉430072

基金项目：	国家自然科学基金;国家自然科学基金

摘要：	在主题深度表示学习的基础上,该文提出了一种融合双语词嵌入的主题对齐模型(topic alignment model, TAM),通过双语词嵌入扩充语义对齐词汇词典,在传统双语主题模型基础上设计辅助分布用于改进不同词分布的语义共享,以此改善跨语言和跨领域情境下的主题对齐效果;提出了2种新的指标,即双语主题相似度(bilingual topic similarity, BTS)和双语对齐相似度(bilingual alignment similarity, BAS),用于评价辅助分布对齐的效果。相比传统的对齐模型MCTA, TAM在跨语言主题对齐任务中双语对齐相似度提升了约1.5%,在跨领域主题对齐任务中F1值提升了约10%。研究结果对于改进跨语言和跨领域信息处理具有重要意义。
关键词：	跨语言主题对齐跨领域主题对齐深度学习双语词嵌入知识对齐
本文献已被 CNKI 万方数据等数据库收录！