基于混合机器学习模型的短文本语义相似性度量算法期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于混合机器学习模型的短文本语义相似性度量算法

引用本文：	韩开旭,袁淑芳.基于混合机器学习模型的短文本语义相似性度量算法[J].吉林大学学报(理学版),2023(4):909-914.

作者姓名：	韩开旭袁淑芳

作者单位：	1. 北部湾大学电子与信息工程学院;2. 北部湾大学理学院

摘要：	为提高短文本语义相似性度量准确性，设计一种基于混合机器学习模型的短文本语义相似性度量算法.先对短文本实施预处理，基于混合机器学习模型构建短文本的字词向量模型，对短文本进行特征扩展；然后组合短文本的多样度量特征，对多样度量特征进行维度规约；最后通过构建一个集成学习模型，计算语义相似性结果，实现语义相似性的度量.使用“Quora Question Pairs”比赛数据集测试该方法的性能，测试结果表明，该方法的准确性较高，对数损失和度量均方差均较低，说明该方法的相似性度量准确性较高.
关键词：	混合机器学习模型短文本文本分词语义相似性卡方检验相似性度量