基于平滑逆频率和依存句法的句子相似度计算方法 |
| |
作者姓名: | 刘继明 谭云丹 袁野 |
| |
作者单位: | 重庆邮电大学经济管理学院,重庆,400065;重庆邮电大学经济管理学院,重庆,400065;重庆邮电大学经济管理学院,重庆,400065 |
| |
摘 要: | 综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中"词语依存关系"三元组的相似性来度量句子间的相似度。实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84. 4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度。
|
关 键 词: | 词平滑逆频率 依存句法 句子相似度计算 |
收稿时间: | 2019-01-07 |
修稿时间: | 2019-03-18 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《科学技术与工程》浏览原始摘要信息 |
|
点击此处可从《科学技术与工程》下载免费的PDF全文 |
|