首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
一种基于内容的信息过滤改进模型   总被引:10,自引:0,他引:10  
根据过滤系统的不同过滤目的,将信息过滤分为两类:(1)基于满足用户信息需求的用户兴趣过滤;(2)基于保障数据安全和社会安全的安全过滤.在详细分析了这两类信息过滤的异同之后,指出了安全过滤研究的特殊性及其主要研究内容.在现有用户兴趣过滤系统模型的基础上,提出了一个基于内容的信息过滤模型,并对模型中新增模块进行了试验.研究结果表明,新增模块能够很好地实现基于内容过滤系统的高精度,证明了该过滤模型具有一定的实用价值.  相似文献   

2.
时下盛行网页视频点播(VOD),视频内容良莠不齐.为保证未成年人的健康上网、安全上网,本文提出并设计了一个网络不良视频信息的过滤系统.该系统通过检测网页视频数据以及监控网页页面来过滤网络不良信息.仿真结果表明这个过滤系统可以较好地对网络不良视频信息进行过滤.  相似文献   

3.
交互式网络具有快捷性、多渠道性和广泛性等特点,同时也为不良信息的发布提供了便利渠道。因此,探讨如何从大量的信息资源中过滤不良信息成具有重要的现实意义。  相似文献   

4.
针对垃圾邮件、不良网页和某些即时消息的威胁,本文以建立一个高效、智能的内容过滤防火墙为目标,提出一个集过滤与监控于一体的智能内容过滤防火墙模型,并依托该模型,实现了一个原型系统。该系统模型具有良好的结构,易于扩展,设计并实现的智能内容过滤系统具有友好的用户交互界面,良好的过滤效果,该系统的研究有助于对内容安全产品的开发,可以有效保障局域网内的内容安全。  相似文献   

5.
传统的防火墙虽然在保障网络安全方面起着十分重要的作用,却不能应对来自互联网不良内容的威胁。针对垃圾邮件、不良网页和即时消息的威胁,本文以建立一个高效、智能的内容过滤防火墙为目标,提出一个集过滤与监控于一体的智能内容过滤防火墙模型,并依托该模型,实现了一个原型系统。本文提出的系统模型具有良好的结构,易于扩展,设计并实现的智能内容过滤系统具有友好的用户交互界面,良好的过滤效果,该系统的研究有助于对内容安全产品的开发,可以有效保障局域网内的内容安全。  相似文献   

6.
针对不良文本的过滤问题,提出一种基于主题分类的文本过滤方法,通过对文本信息进行向量化,引人文本特征抽取技术,筛选出针对文本内容的最优的特征项集合,利用SVM分类技术,来判断文本的态度和立场,达到内容审查过滤的目的.并利用DSP在硬件上加以实现,实验表明该方法同传统的过滤方法相比具有较高的准确率和召回率,且过滤时间大幅减少.  相似文献   

7.
随着网络普及应用,Web内容安全问题已经引起人们的高度重视,对Web内容安全的分类监控已成为研究热点。在分析Web内容安全问题的基础上,提出一种"需求模型",该模型结合向量空间模型(VSM),利用Vague集改进的特征提取策略,扩充原有文档特征表示模型。通过对来自真实网络网页中等规模的语料实验证明,这种"需求模型"可以提高网页内容安全的文本分类效果,分类效果优于采用传统特征的方法。  相似文献   

8.
针对Rocchio容易受到类别样本分布及噪声影响的而导致错误扩大类别范围的问题,提出对训练样本进行聚类,使用聚类形成的多个簇的质心向量替代单个质心向量作为过滤判定向量组的方法。该方法既能保证过滤效率,又比单质心的Rocchio过滤法具有更高的召回率和准确率。  相似文献   

9.
针对垃圾文本识别计算的需求特性,应用VSM文本聚类算法思想,综合现有TFIDF算法特点,提出一种基于VSM和改进的TFIDF特征项提取算法.本方法在对垃圾文本高聚类特征项权值进行放大的同时,有效减小由二类数据样本数量偏差对计算结果带来的影响,提高了垃圾文本过滤识别效率和准确率.为垃圾文本识别提供了一种新的改进算法选择.  相似文献   

10.
通过分析TextCNN和TextRNN等模型的特点,构建了卷积神经网络与循环神经网络相结合的文本分类模型.在“SMS Spam Collection v.1”数据集上对模型进行测试,选用AUC和Precision等评价指标来评价模型.结果表明,模型有良好的鲁棒性,能够准确识别垃圾邮件.  相似文献   

11.
将基于数据库过滤与基于文本内容过滤两种过滤方式相结合,采用分级匹配过滤的策略,利用相关技术对收集到的网页进行处理。最后结合准确率和查全率这两个系统评价指标,提出一种新的指标,即F1测试值对实验结果进行测评。  相似文献   

12.
通过介绍主动信息服务存在的安全性问题,提出了将传统信息过滤技术应用于解决该问题的方法。在此基础上,通过介绍信息过滤技术的相关内容,定义了一种以过滤目的为标准的新的信息过滤分类形式——用户过滤和安全过滤,并对网络信息安全过滤技术的实现做了进一步研究。  相似文献   

13.
李斌  丁上凌 《科技信息》2011,(26):218-218,221
本文对传统防火墙技术在内容安全方面的局限性进行了分析,介绍了字符串匹配算法,提出了一种新型灵活高效的防火墙的体系结构和设计方法,它能在网络层截获数据包获得包头信息,如果判断是非法的IP分组,则防火墙直接丢弃该数据包,加快了防火墙内容过滤的效率。并展望了新的模式匹配算法和防火墙技术。  相似文献   

14.
针对网络文本信息的安全性判别问题,采取改进的邻近分类算法挖掘文本.该改进邻近分类方法在传统方法定义分类特征的同时,起用共线性判别矩阵,对具有共线属性的特征合并处理.这种改进策略,不仅可以增加分类特征的准确性,也可以加快文本信息的分类进程.对Spambase语料库开展实验研究,从精度、召回率、联判度、误差4个维度对分类效果进行评价.结果显示:改进的邻近分类方法具有明显的优势,可以更加准确地区分安全文本和危险文本.  相似文献   

15.
基于文本内容分析的过滤技术研究   总被引:7,自引:1,他引:7  
提出一种基于特征词和局部语义分析的文本分类与过滤方法,在基于特征词统计特性分析的基础上,将特征词的知识属性和局部语法匹配引入信息过滤模型,实验结果表明,这种方法对于某些领域的文本信息可以有效地进行识别和过滤.  相似文献   

16.
针对目前网页分类以及相关研究的问题,提出了基于文本内容的超链接分类思想,为下一步进行信息抽取、话题追踪等互联网信息应用研究做了更好的准备.通过对特定领域内应用两种分类方法对其进行对比研究,取得了较好的效果.  相似文献   

17.
运用内容分析法,开展了对五台山游客的需求信息分析,研究结果表明:游客需求信息分类有7大类,分别为餐饮、住宿、交通、游览、购物、娱乐和其他信息,所占比例分别为8.6%,15%,21.5%,14.0%,5.0%,7.0%,28.9%,由此可见游客需求主要在于住宿、交通、其他信息.研究结果为五台山旅游景区管理服务质量提供参考.  相似文献   

18.
一种基于主动贝叶斯分类技术的垃圾邮件过滤方法   总被引:1,自引:0,他引:1  
目前,将机器学习、文本分类与信息过滤技术相结合的过滤方法成为研究热点.对实际邮件过滤时往往会遇到训练样本中包含大量未带类别标注的邮件,应用传统分类方法存在耗时且过滤性能差等问题,文章提出采用主动贝叶斯分类方法RANB对训练样本进行预处理,以标识其多类别;实验表明,这种方法可有效地提高训练样本质量,提高过滤器性能,在各项评价指标上具备优越性.  相似文献   

19.
在分析标准文献结构和文本分类的基础上,提出基于文本分类的标准文献内容比对模型,实现标准文献内容的快速提取和自动分类,支持相关技术人员和企业轻松快捷地实现标准比对工作,为标准文献比对工作的可持续发展提供方法和策略。  相似文献   

20.
用于中文色情文本过滤的近邻法构造算法   总被引:2,自引:0,他引:2  
从不良信息中最为普及的中文色情文本过滤入手,用近邻法(KNN)算法构造对比了4种特征项选择的方法在中文色情文本中的应用,它们分别是字、词、标点符号和词性等特征.试验表明,中文色情文本不同特征项的选择对中文色情文本的分类效果起到了重要的作用.实验同时表明,所设计的过滤器在保证速度的前提下,很好地完成了基于内容的高精度过滤.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号