首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到15条相似文献,搜索用时 46 毫秒
1.
近年来藏文移动终端的研发和推广工作蓬勃发展,对藏文化的发展产生了深远的影响,但同时也给信息安全带来了巨大挑战。文章分析了藏文移动终端、藏文手机输入法和藏文垃圾短信过滤现状,探讨了朴素贝叶斯算法在垃圾短信过滤中的应用,最后提出了基于朴素贝叶斯算法的藏文垃圾短信过滤的相关问题,并研究了相关关键技术。  相似文献   

2.
近年来藏文移动终端的研发和推广工作蓬勃发展,对藏文化的发展产生了深远的影响,但同时也给信息安全带来了巨大挑战.文章分析了藏文移动终端、藏文手机输入法和藏文垃圾短信过滤现状,探讨了朴素贝叶斯算法在垃圾短信过滤中的应用,最后提出了基于朴素贝叶斯算法的藏文垃圾短信过滤的相关问题,并研究了相关关键技术.  相似文献   

3.
垃圾短信给人们的生活带来了越来越多的扰乱与不安,改革了传统的朴素贝叶斯分类模型,对垃圾短信进行识别过滤,实验表明该方法提高了准确率,具有较好的分类效果。  相似文献   

4.
目前,手机短信成为了人们所喜爱的一种通信方式,同时也成为了商业广告或诈骗信息的载体,对人们的生活,甚至对社会的安定造成了严重的威胁。因此本文采用贝叶斯文本分类算法对垃圾短信进行了分类,进而实现其过滤,并结合黑白名单技术模拟实现了一垃圾短信过滤系统。通过测试,该系统不仅能较为准确的实现对垃圾短信的过滤,还能减少对合法短信的误判率。  相似文献   

5.
朴素贝叶斯算法在给定输出类别的情况下,需假设属性之间相互独立,然而现实中这个假设一般不成立,导致在属性个数较多或者属性之间相关性较大时,分类效果不是很理想。为了解决这个问题,本文采用优化的模糊C均值聚类及权重计算方法改进朴素贝叶斯算法。首先,基于JS散度构造类别个数的自适应函数优化模糊聚类算法,利用优化后的算法将文本分类整理。然后,采用词频因子优化的TF-IDF算法计算分类后各样本的特征权重,结合样本权重与贝叶斯公式,进行分类计算。最后,为了体现改进的朴素贝叶斯算法的有效性和优越性,将其与原始朴素贝叶斯算法以及其他改进算法进行对比实验。实验结果表明,改进后的算法有效地降低了朴素贝叶斯模型对特征项独立性的要求,提高了分类决策的准确率,且在分类性能和效率上具有一定的优越性。  相似文献   

6.
目前电子邮件得到了广泛的应用,同时垃圾邮件问题也随之而来.本文针对垃圾邮件的处理,从用户的兴趣角度出发,基于朴素贝叶斯算法对垃圾邮件个性化过滤.在朴素贝叶斯算法的条件概率计算中,本文选用了多变量贝努里事件模型的计算方法,最后以VC++6.0为实验平台在Ling-Spam语料库上进行实验.  相似文献   

7.
目前电子邮件得到了广泛的应用,同时垃圾邮件问题也随之而来。本文针对垃圾邮件的处理,从用户的兴趣角度出发,基于朴素贝叶斯算法对垃圾邮件个性化过滤.在朴素贝叶斯算法的条件概率计算中,本文选用了多变量贝努里事件模型的计算方法,最后以VC++6.0为实验平台在Ling-Spam语料库上进行实验.  相似文献   

8.
本文主要介绍几种文本分类算法以及它们的优缺点,然后通过实验数据证明集成算法在垃圾短信过滤中的优势。  相似文献   

9.
基于特征相关的改进加权朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高.  相似文献   

10.
文本分类是垃圾短信过滤的核心技术,为了在文本分类时实现特征提取,就需要在不影响分类准确性的前提下,减少原始空间的维数.文档频率、信息增益、互信息、统计、期望交叉熵法、文本证据权和主成分分析是目前采用的主要的特征降维方法,通过实验数据对六种方法的性能做比较分析后发现,对于垃圾短信过滤系统而言,信息增益是最优的特征选择方法.  相似文献   

11.
针对传统的单一算法对垃圾邮件进行过滤效果不理想的问题,在分析和研究最小风险贝叶斯算法和AdaBoost算法的基础上,将两者结合在一起,提出一种基于AdaBoost的最小风险贝叶斯的垃圾邮件过滤算法,将其应用到垃圾邮件过滤中,并分别与最小风险贝叶斯算法和AdaBoost算法的过滤效果进行比较,结果表明,该算法能够有效提高...  相似文献   

12.
由于生成参数学习方法以极大似然性为目标,从而导致分类精度较低.针对这一问题,本文提出了一种以最大化分类精度为目标的高效判别参数学习方法.该方法通过在频率估计方法中加入一个判别参数,从而判别性地计算参数的出现频率,加强实例属性与分类类别之间的关联性.在UCI数据集上的实验表明,该方法综合了生成学习与判别学习的优点,分类精度与目前主流的SVM算法相当,但是在训练时间上具有明显的优势.最后将本方法应用于油水层模式识别当中,其分类性能优于其他算法.  相似文献   

13.
垃圾邮件过滤技术研究   总被引:1,自引:0,他引:1  
详尽介绍了现有的电子邮件过滤技术,分析了各种技术的特点,比较了它们的优缺点.对未来的研究方向进行了展望,提出了若干值得研究的问题.  相似文献   

14.
分析目前基于邮件内容过滤技术存在的缺陷,根据垃圾邮件的大量发送和不请自来的行为特征,提出了一种垃圾邮件行为过滤技术.该技术将各邮件服务器组成一个垃圾邮件协作过滤网络,邮件服务器发送邮件时判断其发送行为,然后将发送行为信息加密;在MTA会话阶段,接收方先解密邮件发送行为信息,然后将不请自来的群发行为垃圾邮件进行过滤.实验结果表明,该技术在MTA会话通信阶段能过滤大量不请自来的垃圾邮件,具有较高的准确率和查全率,处理速度也较快,节省大量的网络资源,具有良好的过滤性能.  相似文献   

15.
提出一种过滤垃圾电子邮件的方法.通过tf-idf特征提取方法提取邮件的词汇特征,采用χ2特征选择方法选取有效的特征,并抽取几个具有明显区分能力的结构方面的特征,利用支持向量机算法对垃圾电子邮件进行自动过滤.对中科院中文垃圾邮件语料库(Cspam)的实验,识别正确率达到82%以上,另外,tf-idf词汇特征和结构特征搭配使用可以提高分类的正确率,表明此种方法能提高垃圾电子邮件过滤的准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号