共查询到20条相似文献,搜索用时 71 毫秒
1.
2.
《山西大同大学学报(自然科学版)》2016,(3)
目前,手机短信成为了人们所喜爱的一种通信方式,同时也成为了商业广告或诈骗信息的载体,对人们的生活,甚至对社会的安定造成了严重的威胁。因此本文采用贝叶斯文本分类算法对垃圾短信进行了分类,进而实现其过滤,并结合黑白名单技术模拟实现了一垃圾短信过滤系统。通过测试,该系统不仅能较为准确的实现对垃圾短信的过滤,还能减少对合法短信的误判率。 相似文献
3.
研究了一种基于改进贝叶斯算法的短信分类方法。对中文文本短信,采用文档频度(DF)的特征项提取方法,借助自建短信语料库对改进的贝叶斯分类器进行了实验测试。实验结果表明:改进的分类器可以提高正常短信的通过率,并可以根据新的训练集训练出个性化的分类器,适应短信变化,满足用户的个性化需求,还结合黑白名单过滤机制实现对短信的过滤... 相似文献
4.
5.
谢梅芬 《南京工程学院学报(自然科学版)》2010,8(3)
提出了一种基于构件技术的多媒体短信系统设计方案,从MMS功能需求出发,在体系结构、MMS核心库总体、文件管理的构件化、PUSH消息处理的构件化等多个方面提出具体的设计方案并实现.经过实际应用,发现基于构建技术的该多媒体信息系统功能完善,具有较高的实用性. 相似文献
6.
徐文权 《安庆师范学院学报(自然科学版)》2012,18(2):65-68
结合目前常用的垃圾短信过滤方法,将相似度理论与模糊聚类理论知识相结合,设计出了一款基于Symbi-an OS系统的手机垃圾短信过滤器。此过滤器与单一贝叶斯文本算法和k近邻算法过滤相比,在准确率、正确率和召回率三个指标上都有了一定程度的提高。 相似文献
7.
根据短信可转化为文本的特性,将文本分类算法运用到短信处理技术之中。通过对短信文本进行预处理、特征选择及分类器等步骤,将短信文本按不同领域进行分类,最后分析意见所涉及的领域分类,有针对性地为政府决策提供可靠依据。 相似文献
8.
通过本系统可以对图书会员表中会员的电话号码进行短信群发,也可以对回复的项目投票进行统计分析。系统自身还有对已发短信的查询功能以及查看SIM卡中收到的短信。 相似文献
9.
基于改进分类模型的文本分类系统实现 总被引:1,自引:0,他引:1
吕佳 《重庆师范大学学报(自然科学版)》2009,26(2):79-83
提出一种基于改进的分类模型的文本分类系统来实现文本的自动分类.针对传统的特征提取算法不能很好区分特征词在类内和类间分布情况的缺陷,该系统利用方差对该算法作了改进,用改进的特征提取算法量化各个特征词的权重,为了降低特征向量的维数,采用为每个类建分类器的分类模型,利用遗传算法来修正各个类特征词的权重,直到为每个类训练出能够代表本类的特征向量,最后用这些类的特征向量进行分类.通过在同一数据集上进行对比实验,说明本文提出的改进分类模型的文本分类系统是正确可行的. 相似文献
10.
基于Web内容挖掘的论坛发贴分类推荐技术 总被引:1,自引:0,他引:1
随着Internet基础结构的不断扩大和其所含信息的持续增长,Internet用户感觉越来越容易在WWW服务中"资源迷向".目前提高用户使用效率的方法有页面预取技术、站点动态重构技术和Web个性化推荐技术等.因为网站的页面内容才是用户真正感兴趣的,本文应用了一种基于Web内容挖掘的文本分类技术来实现论坛中贴子的分类推荐... 相似文献
11.
针对目前网页分类以及相关研究的问题,提出了基于文本内容的超链接分类思想,为下一步进行信息抽取、话题追踪等互联网信息应用研究做了更好的准备.通过对特定领域内应用两种分类方法对其进行对比研究,取得了较好的效果. 相似文献
12.
随着万维网的快速普及和发展,Web上出现了大量短文本,如科技文献摘要、微博和电子邮件等.短文本内容短小,相互联系,已标注数据获得困难,导致传统分类方法很难取得较高的分类精度.为了解决短文本分类问题,提出了一种基于半监督学习的迭代分类算法(SS-ICA).它使用较少的已标记数据,利用短文本间的关系进行迭代分类.通过与常用分类方法进行对比表明,在标注数据较少的情况下SS-ICA比其他分类器有更高的分类精度. 相似文献
13.
互联网中出现的短文本内容短小,相互共享的词汇较少,因此在分类过程中容易出现大量的集外词,导致分类性能降低。鉴于此,提出了一种基于词矢量相似度的分类方法,首先利用无监督的方法对无标注数据进行训练得到词矢量,然后通过词矢量之间的相似度对测试集中出现的集外词进行扩展。通过与基线系统的对比表明,该方法的分类正确率均优于基线系统1%~2%,尤其是在训练数据较少的情况下,所提出的方法的正确率相对提高10%以上。 相似文献
14.
在文本分类中,文本特征向量通常高达几千甚至上万维,给整个分类过程带来了相当庞大的计算量,因此进行有效的降维处理是非常重要的.在不完备信息系统理论的基础上,结合文本分类的特点,提出了一种量化容差关系和启发式的属性约简算法.实验证明该属性约简算法不仅能有效地降低文本特征向量的维度,同时能保证分类的正确率. 相似文献
15.
在文本分类中,文本特征向量通常高达几千甚至上万维,给整个分类过程带来了相当庞大的计算量,因此进行有效的降维处理是非常重要的。在不完备信息系统理论的基础上,结合文本分类的特点,提出了一种量化容差关系和启发式的属性约简算法。实验证明该属性约简算法不仅能有效地降低文本特征向量的维度,同时能保证分类的正确率。 相似文献
16.
刘晓华 《渝西学院学报(自然科学版)》2011,(6):61-63
设计一种基于GPRS的无线数据采集及短消息报警系统.本系统由无线射频数据采集通信模块、无线射频遥控模块、数据采集A/D转换模块、GPRS模块等组成,用于完成环境数据的采集、处理和传输.该系统由1个主站及5个独立子站组成,采集的变电站变压器6路电流值用无线的形式统一到同一个平台上进行数据处理,并通过GSM网络由手机用户进行电流监控、查询和管理. 相似文献
17.
基于GSM短信的信息管理系统开发 总被引:5,自引:0,他引:5
阐述了基于GSM短信的信息管理系统开发.SMS(信息服务)是GSM提供的一项增值业务,无需附加其他终端设备,只需GSM模块便可达到中、英文信息传输的目的.本系统是通过数据线将手机与计算机相连接,利用GSMAT指令控制手机收发短信,并应用数据库对手机短信进行管理,本系统具有人员管理和信息管理功能,可用于发布通知、人员联系等. 相似文献
18.
基于VSM的中文文本分类系统的设计与实现 总被引:25,自引:0,他引:25
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。该文阐述了一个基于向量空间模型的中文文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、训练算法、分类算法等进行了详细介绍。引入标题权重系数改进词语权重,并提出了一种新的分类算法。实验测试结果表明查全率和准确率均达到90%左右,而且标题权重的引入和新分类算法的实施有效地改善了分类性能。 相似文献
19.
介绍了整个系统的网络拓扑、软件结构和整体功能,说明移动查询系统的设计过程,包括查询请求格式的确定、身份认证安全机制及系统实现. 相似文献
20.
赵文娟 《兰州大学学报(自然科学版)》2014,(6):892-896
针对传统Web文本分类方法无法解决大规模分类问题,在深入分析当前主流并行计算平台Hadoop的基础上,提出基于Hadoop的Web文本分类系统,该系统主要包括文本预处理、向量表示、文本分类、结果评价等模块.真实数据集上的比较实验表明所建系统的有效性. 相似文献