首页 | 本学科首页   官方微博 | 高级检索  
     检索      

面向网络舆情分析的语义相似度算法研究
引用本文:魏飞,杨春波,刘守鹏.面向网络舆情分析的语义相似度算法研究[J].山东科学,2014,27(6):73-77.
作者姓名:魏飞  杨春波  刘守鹏
作者单位:滨州医学院,山东 烟台 264003
基金项目:烟台市社会科学规划研究项目(2012-SH-11)
摘    要:本文对广义向量空间模型进行了改进,并利用《知网》义原提出了一种基于义原空间的文本相似度计算方法。此方法根据TF-IDF权重,将文中特征项转化为义原空间中的向量,通过求义原向量之间的夹角余弦值的方式,实现文本相似度的计算。最后进行文本聚类对比实验,结果表明,该方法可以很好地解决舆情分析中的语义漂移问题,使得网络舆情分析的效果有了较大提高。

关 键 词:知网  网络舆情  相似度  
收稿时间:2014-05-14

Network public opinion analysis oriented semantic similarity algorithm
WEI Fei,YANG Chun-bo,LIU Shou-peng.Network public opinion analysis oriented semantic similarity algorithm[J].Shandong Science,2014,27(6):73-77.
Authors:WEI Fei  YANG Chun-bo  LIU Shou-peng
Institution:Binzhou Medical University, Yantai 264003, China
Abstract:We improve the generalized vector space model, and present an original meaning space based text similarity computing method with the "HowNet" sememe. The method converts a feature into a vector in a sememe space with TF- IDF weight, and calculates text similarity by the cosine of the angle between different sememe vectors. We eventually perform text clustering and comparative experiments. Experimental results show that the method can well solve the problem of semantic drift of public opinion analysis, and its effect can be significantly improved.
Keywords:internet public opinion  HowNet  similarity
本文献已被 CNKI 维普 等数据库收录!
点击此处可从《山东科学》浏览原始摘要信息
点击此处可从《山东科学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号