基于字面和语义相关性匹配的智能篇章排序 |
| |
引用本文: | 张芳芳,曹兴超.基于字面和语义相关性匹配的智能篇章排序[J].山东大学学报(理学版),2018(3). |
| |
作者姓名: | 张芳芳 曹兴超 |
| |
作者单位: | 北京大学信息科学技术学院;北京大学计算中心; |
| |
摘 要: | 提出了一种基于字面相关性匹配和语义相关性匹配的深度神经网络模型,用来计算信息检索中查询和文档的匹配得分。字面相关性匹配模型基于查询和文档之间的词共现矩阵,主要考虑查询和文档的字面匹配信息以及匹配词的位置信息;语义相关性匹配模型基于预训练的词向量,进一步通过卷积神经网络提取查询和文档之间不同位置的语义匹配信息,最后的匹配得分是这两个子模型的叠加。损失函数采用hinge loss,通过最大化正负样本之间的分数差来更新参数。实验结果表明,模型在验证集上的NDCG@3和NDCG@5分别可以达到0.790 4和0.818 3,相对于BM25以及单个的字面匹配或者语义匹配模型来说都有很大的提升,这也验证了字面匹配和语义匹配对于信息检索的重要性。
|
本文献已被 CNKI 等数据库收录! |
|