首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于自动编码器的句子语义特征提取及相似度计算
引用本文:马建红,杨浩,姚爽.基于自动编码器的句子语义特征提取及相似度计算[J].郑州大学学报(理学版),2018(2).
作者姓名:马建红  杨浩  姚爽
作者单位:河北工业大学计算机科学与软件学院
摘    要:句子特征提取与相似度计算是自然语言处理中的重要问题.目前汉语句子相似度计算方法不能全面考虑句子语义,因而导致相似度计算结果不够准确.提出了基于深层稀疏自动编码器的句子语义特征提取及相似度计算算法.首先将句子表示为高维、稀疏向量,进一步利用深度无监督学习句子非线性特征,即将高维、稀疏向量变换到低维、本质特征空间,此过程是一种更为纯粹的端到端的学习,避免了建立停用词表、分词等工作,最终得到可直接用于句子相似度计算的低维特征表示.实验结果表明,提取到的句子特征应用于句子相似度计算,与基于关系向量模型的句子相似度计算方法相比,提高了相似度计算准确率,计算的时间复杂度仅为O(n).

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号