首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 312 毫秒
1.
针对垃圾短信分类问题,提出了一种通过挖掘垃圾短信关联规则来构造垃圾短信分类器,从而实现垃圾短信过滤的模型.该方法采用改进的FP-grow算法挖掘垃圾短信关联规则集,以关联规则集为基础构建垃圾短信分类器模型,在分类过程中考虑垃圾短信特征词权重和垃圾短信的变异行为进行分类.实验结果表明,该方法的分类精确率和非垃圾短信错分率优于其他常用垃圾短信分类方法.  相似文献   

2.
垃圾短信给人们的生活带来了越来越多的扰乱与不安,改革了传统的朴素贝叶斯分类模型,对垃圾短信进行识别过滤,实验表明该方法提高了准确率,具有较好的分类效果。  相似文献   

3.
随着商业广告短信、色情短信、骚扰短信等通过手机不断地蔓延,严重地影响了人们日常生活和社会的稳定.因此短信分类已经成为自然语言处理的一个重要领域.分析了近年来垃圾短信内容的发展,提出了一种基于字特征的短信分类方法.实验结果表明,和词特征相比,该方法使有用短信的错判率有了明显的降低.总之,字特征用于短信分类是可行的.  相似文献   

4.
本文主要介绍几种文本分类算法以及它们的优缺点,然后通过实验数据证明集成算法在垃圾短信过滤中的优势。  相似文献   

5.
文本分类是垃圾短信过滤的核心技术,为了在文本分类时实现特征提取,就需要在不影响分类准确性的前提下,减少原始空间的维数.文档频率、信息增益、互信息、统计、期望交叉熵法、文本证据权和主成分分析是目前采用的主要的特征降维方法,通过实验数据对六种方法的性能做比较分析后发现,对于垃圾短信过滤系统而言,信息增益是最优的特征选择方法.  相似文献   

6.
研究了一种基于改进贝叶斯算法的短信分类方法。对中文文本短信,采用文档频度(DF)的特征项提取方法,借助自建短信语料库对改进的贝叶斯分类器进行了实验测试。实验结果表明:改进的分类器可以提高正常短信的通过率,并可以根据新的训练集训练出个性化的分类器,适应短信变化,满足用户的个性化需求,还结合黑白名单过滤机制实现对短信的过滤...  相似文献   

7.
垃圾短信已日益成为影响人们日常生活的严重问题,由于短信属于短文本,长度较短,特征稀疏,尤其是垃圾短信为逃避过滤机制,其结构和内容常常不规范,所以传统的文本特征提取方法并不能完全适用于短信分类。从短信的结构及语义两个角度提取特征项,并建立语义特征词表,采用基于多特征融合的方法来向量化表示短信文本。针对短信数据集中存在的噪声及数据不平衡问题,分别比较了NB、SVM、DT、LR、MLP、RF分类器的性能差别。实验表明,采用RF分类算法,能有效减弱噪声干扰及数据不平衡性所带来的影响。通过在CCF 2015中国好创意竞赛题目“垃圾短信基于文本内容识别”所提供的数据集上进行验证,取得了很好的效果。  相似文献   

8.
结合目前常用的垃圾短信过滤方法,将相似度理论与模糊聚类理论知识相结合,设计出了一款基于Symbi-an OS系统的手机垃圾短信过滤器。此过滤器与单一贝叶斯文本算法和k近邻算法过滤相比,在准确率、正确率和召回率三个指标上都有了一定程度的提高。  相似文献   

9.
"垃圾短信"问题愈演愈烈,成为一大社会公害.通过集团短信业务下发的垃圾短信不断上升,目前已占垃圾短信数量的绝大多数.中国移动广东公司对集团短信业务垃圾信息风险防范策略进行研究,并开发建设了一套基于CMPP协议扩展应用的、能有效检测、控制垃圾短信的系统.  相似文献   

10.
龚之闻 《科技信息》2011,(7):I0047-I0047,I0061
本文主要阐述了一种不用扫描短信内容就能完成对垃圾短信识别判定的方法,通过数据挖掘建立不基于内容的垃圾短信识别模型,使得高性能高准确度的垃圾短信识别成为可能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号