共查询到10条相似文献,搜索用时 15 毫秒
1.
基于百度百科对词语相似度计算进行研究,结合TF-IDF算法和词条百度百科内容,提出一种基于改进TF-IDF的百度百科词语相似度计算方法。TF-IDF算法对文本中词语权重进行计算时,面临部分代表性较好的词语权重较低的问题,通过引进百科词条中词语分布的类别信息,包括词语在类内、类间分布对词语权重的影响改进词语权重计算,此外,根据词语在全集中出现的频率定义词语的代表性,通过计算百科词条中词语的权重因子,构建词条的相关向量,根据向量之间余弦值计算词语相似度。实验表明,相对于不使用TF-IDF方法计算权重和基于经典TF-IDF方法计算权重,结合类别信息的TF-IDF方法和定义代表性的TF-IDF方法提高了词语相似度计算的准确性。 相似文献
2.
3.
4.
5.
模糊k-最近邻(fuzzy k-nearest neighbor,FkNN)及其改进的分类方法忽略了样本存在分布不均匀以及噪声样本的情况,不能充分体现每个类样本特征的差异性,影响了分类的准确率.为此,提出了一种基于紧密度的模糊加权kNN数据分类方法.首先基于样本间紧密度计算样本的隶属度;然后根据特征的模糊熵值分别计算每个类样本特征的权重,并使用加权欧氏距离确定近邻训练样本;最后根据待分类样本所属的每个类别的隶属度确定其类别.对UCI多个数据集的实验结果表明该方法是有效的. 相似文献
6.
一种改进的粗集综合评价方法 总被引:3,自引:0,他引:3
陈自洁 《海南师范大学学报(自然科学版)》2005,18(4):324-329
基于区分矩阵的粗集综合评价方法由于存在对评价对象的反复比较,因此影响了求解指标约简及权重的效率.利用区分矩阵的变形———广义信息表提出的一种改进的粗集综合评价方法,能够减少对对象的重复比较,更快地进行指标约简和权重设置.此外,通过将该方法应用于政府效率评估来验证了方法的可行性和有效性. 相似文献
7.
《哈尔滨师范大学自然科学学报》2018,(6)
评分预测是推荐系统的重要环节,现在大部分的评分预测是利用用户的历史评分记录来推断该用户将给某个项目打多少分.该方法利用了用户历史评分记录,没有充分利用用户或者项目属性,平均绝对误差较大.针对以上问题,构造一种基于用户自画像的评分预测协同过滤推荐算法.该算法通过计算用户之间历史评分记录的相似度和用户自画像之间的相似度,然后计算出两种相似度的权重,把两种相似度乘以各自的权重进行组合.实验结果表明,构造的评分预测算法较好的减少预测评分和实际评分之间的平均绝对误差,提高了评分预测的准确性. 相似文献
8.
9.
张英菊 《湘潭大学自然科学学报》2017,(1):114-118
在改进灰色多层次评价方法的基础上,建立了应急预案实施效果评价模型,并辅以算例对模型进行了验证.改进主要体现在:一是引入专家权重,对AHP群决策中不同专家确定的指标权重进行加权修正;二是构建了基于AHP-熵权法的组合赋权法计算指标权重,避免了传统AHP过于依赖专家的不足;三是在综合评价的基础上,提出计算评价对象单项指标得分的方法.改进后的方法更加严谨,方法体系本身更加完善.根据模型计算结果,可以有针对性地对应急预案进行改进,提升其实施效果. 相似文献