首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于混合机器学习模型的短文本语义相似性度量算法
引用本文:韩开旭,袁淑芳.基于混合机器学习模型的短文本语义相似性度量算法[J].吉林大学学报(理学版),2023(4):909-914.
作者姓名:韩开旭  袁淑芳
作者单位:1. 北部湾大学电子与信息工程学院;2. 北部湾大学理学院
摘    要:为提高短文本语义相似性度量准确性,设计一种基于混合机器学习模型的短文本语义相似性度量算法.先对短文本实施预处理,基于混合机器学习模型构建短文本的字词向量模型,对短文本进行特征扩展;然后组合短文本的多样度量特征,对多样度量特征进行维度规约;最后通过构建一个集成学习模型,计算语义相似性结果,实现语义相似性的度量.使用“Quora Question Pairs”比赛数据集测试该方法的性能,测试结果表明,该方法的准确性较高,对数损失和度量均方差均较低,说明该方法的相似性度量准确性较高.

关 键 词:混合机器学习模型  短文本  文本分词  语义相似性  卡方检验  相似性度量
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号