首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
"垃圾短信"问题愈演愈烈,成为一大社会公害.通过集团短信业务下发的垃圾短信不断上升,目前已占垃圾短信数量的绝大多数.中国移动广东公司对集团短信业务垃圾信息风险防范策略进行研究,并开发建设了一套基于CMPP协议扩展应用的、能有效检测、控制垃圾短信的系统.  相似文献   

2.
垃圾短信制造者出于商业目的或其他诈骗目的向手机用户大量发送垃圾短信或诈骗短信,使得手机用户不胜其扰。运营商在发送短信之前对短信加以辨识后,给可能是垃圾短信的信息贴上标签后再发送,将会大大降低手机用户受骗的机率。该文采用IF-IDF算法和离散特征的贝叶斯分类器,进行特征词选取,构建垃圾短信鉴别模型。通过垃圾短信训练数据集构建的中文垃圾短信贝叶斯分类模型,能够使垃圾短信的识别率保持在94%以上,具有较高的实用性。  相似文献   

3.
《上海信息化》2009,(5):82-82
按照工业和信息化部关于垃圾短信专项行动的部署要求,2009年4月7日,中国电信、中国移动、中国联通在工业和信息化部的指导下,共同签署了“关于网问垃圾短信联动处理框架协议”。该联动框架协议针对社会关注的垃圾短信问题,制定了各基础运营企业联手处理跨网垃圾短信的具体合作流程,明确了垃圾短信发端所属基础运营企业负责主要处置工作,收端所属基础运营企业负责信息收集和用户投诉的协同处理工作。  相似文献   

4.
针对垃圾短信分类问题,提出了一种通过挖掘垃圾短信关联规则来构造垃圾短信分类器,从而实现垃圾短信过滤的模型.该方法采用改进的FP-grow算法挖掘垃圾短信关联规则集,以关联规则集为基础构建垃圾短信分类器模型,在分类过程中考虑垃圾短信特征词权重和垃圾短信的变异行为进行分类.实验结果表明,该方法的分类精确率和非垃圾短信错分率优于其他常用垃圾短信分类方法.  相似文献   

5.
在信息资讯发达的今天,短信已成为日常生活中每天都要接触的东西,但同时垃圾短信也常常困扰着人们,为此,进行垃圾短信过滤成为了一个必要的问题.与普通的分类问题不同,垃圾短信的表现形式为文本数据,且不同的垃圾短信的文本特征各不相同,提高了分类识别的难度.其次,垃圾短信总体来说在所有短信中的占比并不高,因此,常常伴随着类别不平衡,由此样本不平衡带来的信息不充分也提高了识别的难度.针对这些问题,文章首先采取TF-IDF方法进行特征提取,把文本数据转化成向量的形式,然后在经过转换的数据应用欠采样技术获得若干个类别平衡的训练样本,每个样本分别采取朴素贝叶斯、决策树和支持向量机等分类模型进行训练,得到相应基分类器,最后再利用集成学习的思想把基分类器进行模型融合,得到一个分类性能较高的垃圾短信识别模型.  相似文献   

6.
垃圾短信已日益成为影响人们日常生活的严重问题,由于短信属于短文本,长度较短,特征稀疏,尤其是垃圾短信为逃避过滤机制,其结构和内容常常不规范,所以传统的文本特征提取方法并不能完全适用于短信分类。从短信的结构及语义两个角度提取特征项,并建立语义特征词表,采用基于多特征融合的方法来向量化表示短信文本。针对短信数据集中存在的噪声及数据不平衡问题,分别比较了NB、SVM、DT、LR、MLP、RF分类器的性能差别。实验表明,采用RF分类算法,能有效减弱噪声干扰及数据不平衡性所带来的影响。通过在CCF 2015中国好创意竞赛题目“垃圾短信基于文本内容识别”所提供的数据集上进行验证,取得了很好的效果。  相似文献   

7.
目前,手机短信成为了人们所喜爱的一种通信方式,同时也成为了商业广告或诈骗信息的载体,对人们的生活,甚至对社会的安定造成了严重的威胁。因此本文采用贝叶斯文本分类算法对垃圾短信进行了分类,进而实现其过滤,并结合黑白名单技术模拟实现了一垃圾短信过滤系统。通过测试,该系统不仅能较为准确的实现对垃圾短信的过滤,还能减少对合法短信的误判率。  相似文献   

8.
垃圾短信     
《上海信息化》2008,(10):82-82
工信部日前下发《关于垃圾短信息整治专项行动阶段性工作情况通报及下一阶段工作要求的通知》,要求各地进一步加大治理垃圾短信的力度。这是继6月份发文整治垃圾短信行动之后的又一次出击。通知就专项行动重点问题的治理、会同工商部门研究加强短信息广告管理、各地报送信息与加强宣传等情况作了说明,并对下一阶段的专项行动提出了工作要求。  相似文献   

9.
针对目前垃圾短信的识别算法存在的关键字及频次的规则死板,易于被不法分子探测和规避等问题,提出将局部敏感哈希的K邻近算法应用于垃圾短信分类识别;首先定义特征,然后采用局部敏感哈希算法计算向量距离,通过得到的距离衡量矩阵的相似性,量化矩阵相似程度,对本文中提出的优化模型进行实现和训练;基于短信文本内容,运用词频-逆向文本频率算法生成矩阵,利用局部敏感哈希算法求解最相似样本,记录样本类别,将训练结果导入K邻近算法分类器得到最优近邻,在测试集或验证集上对优化模型垃圾短信分类识别准确率进行评测。结果表明,经过K邻近算法分类器后,优化模型垃圾短信分类识别准确率达到98.7%。  相似文献   

10.
王研 《科技资讯》2015,13(4):24+26
近年来,垃圾短信愈发泛滥,这种行为不但极大危害了用户的切身利益,而且对于联通的品牌打造也制造了很大的障碍。因此,对运营商的监管提出了更高的要求。该文综合比对了主流的垃圾短信拦截方案,最后明确了所采用的基于发端短信中心实时控制的垃圾短信拦截方案。通过采用系统自动处理和人工审核相结合的方式,垃圾短信治理工作取得了显著的成果。最后,该文结合目前垃圾短信治理的形势,对最新的基于可疑度的垃圾短信拦截机制进行了介绍,对后期的治理工作提出了展望。  相似文献   

11.
分析了网络环境下的主要信息垃圾源,提出了防治信息垃圾的措施。指出强化全民防治信息垃圾的意识,增强政府的宏观调控职能,健全防止信息垃圾生产、传播的法律法规,进一步密切文献生产、收藏、利用者的关系,就能将信息垃圾的侵害降低到最低限度。  相似文献   

12.
为适应社会发展需求,垃圾收费作为环卫行业的一项主要工作,应逐渐实现高科技信息化管理。基于SQL Server设计并开发了一套C/S模式的垃圾收费信息管理系统。具有界面友好、使用灵活简单等特点,在宝鸡市垃圾收费处已正式投入使用。该系统运行状态良好,用户反馈评价优良,达到了预期需求的开发目标。  相似文献   

13.
基于Web Services的综合信息采集平台   总被引:2,自引:0,他引:2  
为了解决目前企业信息系统中分散、异构信息源的信息共享以及各个分散异构信息源中的数据不能被有效集成的问题,在Web Services的基础上采用数据即服务(Data As Service)的概念,构建了一种面向服务的数据集成体系结构,根据此体系结构结合Web服务技术设计了综合信息采集平台系统.该系统在实现异构系统、异构信息源间信息的共享的基础上,有效地集成了异构信息源的数据,而且形成了统一的数据视图提供给用户.最后给出了综合信息采集平台系统的一个应用实例.  相似文献   

14.
网络信息传播在给人们带来便利的同时,也带来了负面影响,如不良信息、虚假信息、信息垃圾、信息安全问题等。建设依法治网、以德治网、技术治网"三位一体"的网络信息传播治理体系,有利于加强网络信息传播的管理,让网络信息传播更好地为人们提供服务。  相似文献   

15.
在调查统计分析的基础上,对科技信息用户的信息行为进行了研究,并对面向科技信息用户的信息服务实践进行了探讨。  相似文献   

16.
随着社会的信息化,信息用户已向多元化方向发展.不同类型用户的信息需求研究已成为现阶段信息用户研究的热点.政府信息资源用户类型多样,其信息需求也不同,笔者通过分析信息用户类型与信息需求的联系,对政务信息建设提出了个性化、一站式与知识服务等建议.  相似文献   

17.
随着互联网和社会的飞速发展,新词不断涌现。识别和整理这些新词语,是中文信息处理中的一个重要研究课题。提出一种新词识别方法,该方法利用基于PAT-Array的重复字符串抽取候选串,提高了新词的召回率。并在此基础上分析新词内部模式,添加了垃圾串过滤机制。单字串过滤主要是运用垃圾词典的方法,多字词模式新词的确定是利用改进的互信息与独立成词概率结合的方法。由此,大幅度提高了新词识别的准确率。  相似文献   

18.
A Compositive Information Collection Platform System Based on Web Service   总被引:1,自引:0,他引:1  
WeTbh ese grvoiacle oisf atnhise mteercghinnoglotgeych inso ltoog yacihnireevcee nutn iyveearrssa l.seamless communication and sharing data between differentapplications without considering platform. Based on XML,Web service introduced a novel schema to describe,registerand search service, which resolves the problemof informationisland[1 ,2]andrealizes data sharing.Onthe other hand,intheprocess of business information, due to the i mpact of stag-gered,technical and some other artist factors …  相似文献   

19.
智能信息检索代理结构   总被引:2,自引:0,他引:2  
信息过载已成为Internet用户信息检索时的最大难题,利用智能信息检索代理技术可解决这些问题.在对智能代理特征(主要包括智能搜索,导航向导,自动通告,个人信息管理,动态个人化网页,以及页面辅助阅读工具等)进行分析的基础上,参照模块化的代理结构,讨论了智能Agent的各组成模块功能和各个模块在实现不同功能时的组织方法.经过初步实践表明,智能Agent用于提高信息检索效率和减小网络信息过载是可行和有效的.  相似文献   

20.
网络信息用户的教育培训是信息用户教育培训发展中的一个重要方面.网络信息用户教育培训的基本内容是信息素质的教育培训和信息技能的教育培训,开展网络信息用户教育培训所应采取的一些策略:开发网络信息用户教育培训的系统软件、建立有效的约束机制、加强社会合作、丰富教育培训的手段.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号