首页 | 本学科首页   官方微博 | 高级检索  
     检索      

由向量空间相关模型识别博客文章的垃圾评论
引用本文:何海江,凌云.由向量空间相关模型识别博客文章的垃圾评论[J].长沙大学学报,2008,22(2):63-66.
作者姓名:何海江  凌云
作者单位:长沙大学计算机中心,湖南,长沙,410003
基金项目:长沙大学校科研和教改项目
摘    要:博客作者往往允许读者在文章后发表评论,许多评论充斥着形形色色的垃圾信息,破坏了博客社区的和谐.在向量空间的基础上构造了一个相关模型,将博客的文章和评论分别分词后,根据模型计算评论和文章的相关度,来判断是否为垃圾评论.该模型不需要训练样本,在一个中文博客测试集上,召回率和准确率分别达到82%和91%.

关 键 词:向量空间模型  博客  垃圾评论  相关度
文章编号:1008-4681(2008)02-0063-04
修稿时间:2007年11月16
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号