由向量空间相关模型识别博客文章的垃圾评论 |
| |
引用本文: | 何海江,凌云.由向量空间相关模型识别博客文章的垃圾评论[J].长沙大学学报,2008,22(2):63-66. |
| |
作者姓名: | 何海江 凌云 |
| |
作者单位: | 长沙大学计算机中心,湖南,长沙,410003 |
| |
基金项目: | 长沙大学校科研和教改项目 |
| |
摘 要: | 博客作者往往允许读者在文章后发表评论,许多评论充斥着形形色色的垃圾信息,破坏了博客社区的和谐.在向量空间的基础上构造了一个相关模型,将博客的文章和评论分别分词后,根据模型计算评论和文章的相关度,来判断是否为垃圾评论.该模型不需要训练样本,在一个中文博客测试集上,召回率和准确率分别达到82%和91%.
|
关 键 词: | 向量空间模型 博客 垃圾评论 相关度 |
文章编号: | 1008-4681(2008)02-0063-04 |
修稿时间: | 2007年11月16 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|